网抓遇到多个网抓遇到一个页面有多个<html> </html>

网抓遇到不规范的网页，一个网页里面有多个该咋办，BeautifulSoup只会处理第一个的内容

没问题吧？

from bs4 import BeautifulSoup
s='''
<html><a>aa</a></html>
<html><a>bb</a></html>
'''

soup=BeautifulSoup(s,'html.parser')
print(soup.select('a'))