谢谢!!
import bs4
soup=bs4.BeautifulSoup(res.tex,"html.parser")
x=soup.find_all("div",class_="hd") #?
for y in x:
print(y.a.sapn.text)#?
soup是搜索到检查中源代码的全部内容,然后x是在全部内容里搜索div 中class=hd的全部内容,也就是说x是多条<div class=hd>的信息,y是x的每一条的显示,打印具体内容是<div class=hd>中的a标签中的span标签下的文本内容
没记错的话应该是:
1.将res.txt文件当成html文件读取
2.查找所有class为hd的div
3.判断y在不在x里面,在的话输出y里面的a标签里面的span标签的内容。
举个例子:
如果res.txt里面有下面的代码
<div class="hd">
<a>
<span>hello</span>
</a>
</div>
那么结果会输出hello