import requests
from lxml import etree
url = "https://yichang.zbj.com/search/service/?kw=saas&l=0&r=2"
resp = requests.get(url)
html = etree.HTML(resp.text)
divs = html.xpath('//*[@id="__layout"]/div/div[3]/div/div[4]/div[4]/div[1]')
for div in divs:
price = div.xpath("./div/div/div[2]/div[1]/span/text()")
print(price)
本来price应该是一个一个的列表,每个列表里应该是存有一个价格,为什么运行后price是一个大表格包括所有的数据
['1980', '1200', '3688', '900', '1200', '1688', '1288', '1699', '1000', '1000', '4800', '899', '1800', '100', '200', '35000', '3800', '1980', '800', '1000', '1000', '1980', '3588', '498', '498', '1888', '3500', '2000', '2688', '19800', '1000', '10000', '1888', '1699', '1888', '298', '4500', '2000', '5000', '5000', '50000', '500', '999']
你是以为xpath用了两次,就会list嵌套吗?还是一个list的
1、可以在循环中加上延迟看看结果是否一样
2、有可能是网页内容在第一次全部提取成功
3、结果全在一起并不影响使用