from requests_html import HTMLSession
se = HTMLSession()
url =' https://www.jipinwx.cc/daomubiji8/1586266.html' https://www.jipinwx.cc/daomubiji8/1586266.html'
r = se.get(url)
r.encoding = r.apparent_encoding
#print(r.text)
cc = r.html.xpath('//div[@class="contentbox"]', first=True).text
print(cc)
#这个first作用到底是什么?不添加first=True括号后面的text就会报错,但是既然是第一个为真实的意思,为什么会把网页上第二个元素也打印出来了,就是后面多了多余的文字,但是我也换过另外一个网站,只打印第一个,小说文字都没有,实在不明白怎么回事???
看了一下官方文档,first参数的意思是是否只返回第一个对象,因为正常的xpath返回的是一个element的列表,而first=true之后就是一个element对象,你可以对一个对象调用text属性,但不能对列表这么调用