Python Xpath对<em>标签的爬取结果变成了- -(关键词-Xpath)

######Python Xpath对标签的爬取结果变成了- -

在爬取网页中的信息，结果乱码

tree = etree.HTML(html1) # print(tree) ticket = tree.xpath('//*[@id="weekMT_total"]/text()')[0] print(ticket)
--
--
--
曾经使用beautiful soup写的结果相同，后来改用Xpath，还是出现这次问题

你的代码没问题哟,你最好打印下html1,然后核对下html1是不和你预期是一样的

使用lxml库，它提供了更强大的XPath支持，可以更好地处理标签。例如，可以使用以下代码：

from lxml import etree html = '<html><body><em>Some text</em></body></html>' doc = etree.HTML(html) result = doc.xpath('//em/text()') print(result)

输出一下html1,看页面内容里是否有这个数据，ctrl+f全局搜索就行，有可能是动态加载的

你可以参考下这篇文章：python爬虫----使用xpath解析数据

Python Xpath对<em>标签的爬取结果变成了- -(关键词-Xpath)

在爬取网页中的信息，结果乱码

--

--

--

曾经使用beautiful soup写的 结果相同， 后来改用Xpath，还是出现这次问题

曾经使用beautiful soup写的结果相同，后来改用Xpath，还是出现这次问题