Python Xpath对<em>标签的爬取结果变成了- -(关键词-Xpath)

######Python Xpath对标签的爬取结果变成了- -

在爬取网页中的信息,结果乱码

img

tree = etree.HTML(html1)
            # print(tree)
            ticket = tree.xpath('//*[@id="weekMT_total"]/text()')[0]
            print(ticket)

img

--

--

--

曾经使用beautiful soup写的 结果相同, 后来改用Xpath,还是出现这次问题

你的代码没问题哟,你最好打印下html1,然后核对下html1是不和你预期是一样的

使用lxml库,它提供了更强大的XPath支持,可以更好地处理标签。例如,可以使用以下代码:

from lxml import etree
html = '<html><body><em>Some text</em></body></html>'
doc = etree.HTML(html)
result = doc.xpath('//em/text()')
print(result)

输出一下html1,看页面内容里是否有这个数据,ctrl+f全局搜索就行,有可能是动态加载的