python爬虫使用xpath提取信息部分失败

用xpath提取猪八戒网的数据，为啥一半提取成功一半空列表

import requests
from lxml import etree

url = "https://beijing.zbj.com/search/service/?l=0&kw=saas&r=2"
resp = requests.get(url)
# print(resp.text)

# 把html源码进行加载解析
html = etree.HTML(resp.text)
# 拿到每一个服务商的div
divs = html.xpath('//*[@id="__layout"]/div/div[3]/div[1]/div[4]/div/div[2]/div[1]/div')
# print(divs)
for div in divs:  # 每一个服务商信息
    price = div.xpath("./div/div[2]/div[1]/span/text()")
    title = div.xpath("./div/a/div[2]/div[1]/div/text()")
    print(price)
    print(title)

resp.close()

以下回答结合了ChatGPT：
这段代码没有使用socket连接获取HTML内容，而是使用了requests库发送HTTP GET请求获取HTML内容。如果你已经获取到了HTML内容，可以使用base64和webbrowser模块将其在浏览器中打开。

以下是将HTML内容转换为base64编码并在浏览器中打开的代码：


import base64
import webbrowser

# 将HTML内容转换为base64编码
html_content = resp.text.encode('utf-8')
html_base64 = base64.b64encode(html_content).decode('utf-8')

# 将base64编码后的HTML内容嵌入到data URI中
html_data_uri = 'data:text/html;base64,' + html_base64

# 在浏览器中打开HTML内容
webbrowser.open(html_data_uri)

注意，这段代码中的resp变量应该是从之前的代码中获取到的requests响应对象。

这有个类似的问题, 你可以参考下: https://ask.csdn.net/questions/7542200
你也可以参考下这篇文章：利用python爬虫(part6)--用Xpath匹配带来的数据合并问题
除此之外, 这篇博客: 【Python从零到壹】使用XPath解析数据爬取起点小说网数据中的 使用xpath获取起点小说网的数据 部分也许能够解决你的问题, 你可以仔细阅读以下内容或跳转源博客中阅读:

# 作者：互联网老辛
# 开发时间：2021/4/8/0008 8:24

import requests
from lxml import etree
url="https://www.qidian.com/rank/yuepiao"
headers={'user-agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3861.400 QQBrowser/10.7.4313.400'}
#发送请求
resp=requests.get(url,headers)
e=etree.HTML(resp.text) #类型转换，把str转变为class 'lxml.etree._ELement
print(type(e))
names=e.xpath('//div[@class="book-mid-info"]/h4/a/text()')
authors=e.xpath('//p[@class="author"]/a[1]/text()')
print(names)
print(authors)
#名称和作者对应
for name,authors in zip(names,authors):
    print(name,":",authors)

您还可以看一下 Ace老师的Python爬虫开发进阶课程中的第十一讲：实战：运用xpath语法下载小说(一)小节, 巩固相关知识点