PyQuery库爬取标签a中的herf。只能爬到第一个。gui'qiu

def pa():
html = browser.page_source
doc = pq(html)
items = doc (".block-items").items()
print(items)
for item in items:
product={
"link":item.find(".title").attr("href"),
"name":item.find(".title").text(),
"title": item.find(".title-info").text(),
}
print(product)

像name title 都可以遍历。唯独网址href 只能爬取到第一个。求帮帮怎么办 xie'xie'l

网址贴出来看下,不知道网页内容无法做出判断

htmlstr = ' 煤炭开采加工 https://ask.csdn.net/blockInfo/210200/ 燃气水务 https://ask.csdn.net/blockInfo/210100/ 传媒 https://ask.csdn.net/blockInfo/720100/ 电气设备 https://ask.csdn.net/blockInfo/630200/ 半导体及元件 https://ask.csdn.net/blockInfo/270100/ 电子制造 https://ask.csdn.net/blockInfo/270500/ 其他电子 https://ask.csdn.net/blockInfo/270400/ 房地产开发 https://ask.csdn.net/blockInfo/430100/ 服装家纺 https://ask.csdn.net/blockInfo/350200/ 保险及其他 https://ask.csdn.net/blockInfo/490200/ 零售 https://ask.csdn.net/blockInfo/490300/ 证券 https://ask.csdn.net/blockInfo/490100/ 钢铁 https://ask.csdn.net/blockInfo/230100/ 电力 https://ask.csdn.net/blockInfo/410100/ 环保工程 https://ask.csdn.net/blockInfo/410400/ 船舶制造 https://ask.csdn.net/blockInfo/650400/ 国防军工 https://ask.csdn.net/blockInfo/650200/ 化工合成材料 https://ask.csdn.net/blockInfo/220400/ 化学制品 https://ask.csdn.net/blockInfo/220100/ 基础化学 https://ask.csdn.net/blockInfo/220500/ 金属制品 https://ask.csdn.net/blockInfo/640400/ 通用机械 https://ask.csdn.net/blockInfo/640100/ 仪器仪表 https://ask.csdn.net/blockInfo/640300/ 专用设备 https://ask.csdn.net/blockInfo/640200/ 计算机应用 https://ask.csdn.net/blockInfo/710200/ 白色家电 https://ask.csdn.net/blockInfo/330100/ 纺织制造 https://ask.csdn.net/blockInfo/610200/ 建筑材料 https://ask.csdn.net/blockInfo/610300/ 通信服务 https://ask.csdn.net/blockInfo/620300/ 园林工程 https://ask.csdn.net/blockInfo/620500/ 建筑装饰 https://ask.csdn.net/blockInfo/620200/ 港口航运 https://ask.csdn.net/blockInfo/420100/ 公路铁路运输 https://ask.csdn.net/blockInfo/420200/ 公用事业 https://ask.csdn.net/blockInfo/420300/ 非汽车交运 https://ask.csdn.net/blockInfo/420500/ 物流 https://ask.csdn.net/blockInfo/420800/ 种植业与林业 https://ask.csdn.net/blockInfo/110600/ 汽车整车 https://ask.csdn.net/blockInfo/280400/ 汽车零部件 https://ask.csdn.net/blockInfo/280200/ 包装印刷 https://ask.csdn.net/blockInfo/360200/ 家用轻工 https://ask.csdn.net/blockInfo/360300/ 造纸 https://ask.csdn.net/blockInfo/360100/ 贸易 https://ask.csdn.net/blockInfo/450200/ 商业物业经营 https://ask.csdn.net/blockInfo/450500/ 饮料制造 https://ask.csdn.net/blockInfo/340300/ 通信设备 https://ask.csdn.net/blockInfo/730200/ 计算机设备 https://ask.csdn.net/blockInfo/730100/ 景点及旅游 https://ask.csdn.net/blockInfo/460300/ 文教休闲 https://ask.csdn.net/blockInfo/460500/ 医疗器械服务 https://ask.csdn.net/blockInfo/370600/ 医药商业 https://ask.csdn.net/blockInfo/370400/ 中药 https://ask.csdn.net/blockInfo/370200/ 银行 https://ask.csdn.net/blockInfo/480100/ 新材料 https://ask.csdn.net/blockInfo/240200/ 有色冶炼加工 https://ask.csdn.net/blockInfo/240500/ 综合 https://ask.csdn.net/blockInfo/510100/ 通用设备 https://ask.csdn.net/blockInfo/BK0735/ 光学光电子 https://ask.csdn.net/blockInfo/BK0734/ 农产品加工 https://ask.csdn.net/blockInfo/BK0732/ 养殖业 https://ask.csdn.net/blockInfo/BK0730/ 生物制品 https://ask.csdn.net/blockInfo/BK0477/ 化学制药 https://ask.csdn.net/blockInfo/BK0476/ '
doc1 = pq(htmlstr)
print(doc1('a').attr('href'))

确实只能获取到第一条的链接