Python爬虫中国大学排名

我写运行报错

import requests
from bs4 import BeautifulSoup

headers={" User-Agent":" user-agent: Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.89 Safari/537.36 SLBrowser/7.0.0.5211 SLBChan/27"}
for i in range(0,4):
    page=i*30
    url="http://www.zuihaodaxue.cn/zuihaodaxuepaiming2016.html" 
    response=requests.get(url,headers=headers)
    html=response.text
    soup=BeautifulSoup(html,"lxml")
    content_all=soup.find_all(class_="title")
    for content in content_all:
        contentString=content.string
        print(contentString)

 

是由于你user-agent中带了非必要的空格造成的。

headers = {
        'User-Agent': 'Mozilla / 5.0(Windows NT 10.0;Win64;x64) AppleWebKit / 537.36(KHTML, likeGecko) Chrome / 89.0.4389.90Safari / 537.36'
    # 请求的客户端信息
    }

一般形式是这样,你多打了user-agent

修改之后报一样的错吗?

 

https://cncert.github.io/requests-html-doc-cn/#/?id=%E5%AE%89%E8%A3%85  用这个请求解析库试试

您好,我是有问必答小助手,您的问题已经有小伙伴解答了,您看下是否解决,可以追评进行沟通哦~

如果有您比较满意的答案 / 帮您提供解决思路的答案,可以点击【采纳】按钮,给回答的小伙伴一些鼓励哦~~

ps:问答VIP仅需29元,即可享受5次/月 有问必答服务,了解详情>>>https://vip.csdn.net/askvip?utm_source=1146287632