如图,想要获取评分和评分人数。其中novelreview_div具有唯一性。
我随便写的代码如下,有错。还望各位朋友们帮忙,感谢。
findCopywrite = re.compile(r'<div">(.*?)</div>', re.U)
soup = BeautifulSoup(html, "html.parser")
for item in soup.find_all('div',class_='novelreview_div'):
item = str(item)
copywrite.append(re.findall(findCopywrite, item))
一个取巧的方法:
# span后面的懒得写了。。正则表达式的前后缀你可以改动一下
list_match = re.findall(r'<span...>(.*?)</span>', re.findall(r'id="novelreview_div"(.*?)“已评分比例', html, re.S)[0])
grade = list_match[0]
number = list_match[1]
希望能贴出代码,方便调试