网抓遇到不规范的网页,一个网页里面有多个 该咋办,BeautifulSoup只会处理第一个 的内容
没问题吧?
from bs4 import BeautifulSoup s=''' <html><a>aa</a></html> <html><a>bb</a></html> ''' soup=BeautifulSoup(s,'html.parser') print(soup.select('a'))