爬去网页为什么不成功

img


想问一下各位大佬为什么爬去网页不成功

if __name__=='__main__':
name和main两侧都是双下划线,修改一下再跑试试
pycharm可以通过输入main快速生成上述语句
有帮助望采纳~

因为你的爬虫代码中没有请求头,所以搜狗会识别出你是一个爬虫,需加一个headers,代码如下。

import requests
headers={"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/95.0.4638.69 Safari/537.36"}
url='https://www.sougou.com/'
res=requests.get(url,headers=headers)
print(res.text)

如有帮助,希望采纳~