xpath怎么提取数字

请问网页里用xpath怎么提取数字,在网页里复制xpath路径给的是text,但用text提取的又是一个空列表

类似这样,最后用/text()提取就行了哇,匹配的空列表说明你的xpath错误呢!

from lamp import etree
html = etree.HTML(wb_data)
html_data = html.xpath('/html/body/div/ul/li/a[@href="link2.html"]/text()')
print(html_data)
for i in html_data:
    print(i)

有帮助的话采纳一下哦!

不知道你这个问题是否已经解决, 如果还没有解决的话:
  • 你可以参考下这个问题的回答, 看看是否对你有帮助, 链接: https://ask.csdn.net/questions/7691510
  • 我还给你找了一篇非常好的博客,你可以看看是否有帮助,链接:python爬虫之xpath格式转换与去除多余标签、解决部分重定向问题的方法
  • 除此之外, 这篇博客: 爬虫-用xpath爬取豆瓣图书的短评中的 Xpath的使用 部分也许能够解决你的问题, 你可以仔细阅读以下内容或者直接跳转源博客中阅读:

    导入lxml——>返回xml结构——>寻找数据

    from lxml import etree
    
    url = ""
    
    s = etree.HTML(url)
    
    print(s.xpath())

    1.获取文本内容用text()

    2.获取注释用comment()

    3.获取其他任何属性用@xx,如

    • @href
    • @src
    • @value

    4.想获取某个标签下的所有文本(包括子标签下的文本),使用string

    5.starts-with 匹配字符串前面相等

    6.contains 匹配任何位置相等

    下面用xpth爬取豆瓣读书 


如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^