用pychram打印不出来数据

img

img

img

img


用xpath插件在浏览器可以找出来,但是在pychram里面打印不出来,打印为空,问题在哪里啊,谢谢啦

没问题吧?题主print(content)看下返回什么内容?

可能ip被禁了获取不到实际内容,或者换个user-agent试试

img

from lxml import etree
import requests
url='https://movie.douban.com/review/14320594/'
headers={'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/100.0.4896.60 Safari/537.36 Edg/100.0.1185.29'}
response=requests.get(url=url,headers=headers)
content=response.content.decode('utf-8')

tree=etree.HTML(content)

title=tree.xpath('//*[@id="content"]/div/div[2]/div[4]/div[2]/a/text()')
print(title)

img

建议把html内容保存下载,本地打开浏览器查下xpath能否匹配。浏览器的xpath,有些在代码中不一定能匹配到。因为浏览器页面有js渲染等影响。

您好,我是有问必答小助手,您的问题已经有小伙伴帮您解答,感谢您对有问必答的支持与关注!
PS:问答VIP年卡 【限时加赠:IT技术图书免费领】,了解详情>>> https://vip.csdn.net/askvip?utm_source=1146287632