没问题吧?题主print(content)看下返回什么内容?
可能ip被禁了获取不到实际内容,或者换个user-agent试试
from lxml import etree
import requests
url='https://movie.douban.com/review/14320594/'
headers={'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/100.0.4896.60 Safari/537.36 Edg/100.0.1185.29'}
response=requests.get(url=url,headers=headers)
content=response.content.decode('utf-8')
tree=etree.HTML(content)
title=tree.xpath('//*[@id="content"]/div/div[2]/div[4]/div[2]/a/text()')
print(title)
建议把html内容保存下载,本地打开浏览器查下xpath能否匹配。浏览器的xpath,有些在代码中不一定能匹配到。因为浏览器页面有js渲染等影响。
您好,我是有问必答小助手,您的问题已经有小伙伴帮您解答,感谢您对有问必答的支持与关注!