我写运行报错
import requests
from bs4 import BeautifulSoup
headers={" User-Agent":" user-agent: Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.89 Safari/537.36 SLBrowser/7.0.0.5211 SLBChan/27"}
for i in range(0,4):
page=i*30
url="http://www.zuihaodaxue.cn/zuihaodaxuepaiming2016.html"
response=requests.get(url,headers=headers)
html=response.text
soup=BeautifulSoup(html,"lxml")
content_all=soup.find_all(class_="title")
for content in content_all:
contentString=content.string
print(contentString)
是由于你user-agent中带了非必要的空格造成的。
headers = {
'User-Agent': 'Mozilla / 5.0(Windows NT 10.0;Win64;x64) AppleWebKit / 537.36(KHTML, likeGecko) Chrome / 89.0.4389.90Safari / 537.36'
# 请求的客户端信息
}
一般形式是这样,你多打了user-agent
修改之后报一样的错吗?
https://cncert.github.io/requests-html-doc-cn/#/?id=%E5%AE%89%E8%A3%85 用这个请求解析库试试
您好,我是有问必答小助手,您的问题已经有小伙伴解答了,您看下是否解决,可以追评进行沟通哦~
如果有您比较满意的答案 / 帮您提供解决思路的答案,可以点击【采纳】按钮,给回答的小伙伴一些鼓励哦~~
ps:问答VIP仅需29元,即可享受5次/月 有问必答服务,了解详情>>>https://vip.csdn.net/askvip?utm_source=1146287632