请问网页里用xpath怎么提取数字,在网页里复制xpath路径给的是text,但用text提取的又是一个空列表
类似这样,最后用/text()提取就行了哇,匹配的空列表说明你的xpath错误呢!
from lamp import etree
html = etree.HTML(wb_data)
html_data = html.xpath('/html/body/div/ul/li/a[@href="link2.html"]/text()')
print(html_data)
for i in html_data:
print(i)
有帮助的话采纳一下哦!
不知道你这个问题是否已经解决, 如果还没有解决的话:导入lxml——>返回xml结构——>寻找数据
from lxml import etree
url = ""
s = etree.HTML(url)
print(s.xpath())
1.获取文本内容用text()
2.获取注释用comment()
3.获取其他任何属性用@xx,如
4.想获取某个标签下的所有文本(包括子标签下的文本),使用string
5.starts-with 匹配字符串前面相等
6.contains 匹配任何位置相等
下面用xpth爬取豆瓣读书