第 一 次 接 触 爬 虫
谁 能 告 诉 我 下 面 这 个 问 题 如 何 解 决
大哥 把你的代理关了吧(机场/VPN)
直接安装requests库
import requests
request.get(url)即可。
我之前使用过爬虫,还写了相关的文章,看你好像也是在学习爬虫,可以看看我的博文。
1、如果想要成功获得数据,要考虑反爬措施,例如加入请求头参数等
2、如果你在学习爬虫,可以抽空看看我的博客文章,爬虫部分还是很详细的
你这个错误是因为开了代理,把代理关了再用
res =requests.get(url)
print(res.text)
你的URL 错了吧 试试这个
from urllib.request import urlopen
url = 'https://www.baidu.com/'
response = urlopen(url)
print(response.read())
多了一个 w,你把百度网址写了 4个 w
你的URL 把百度网站的 https://www.baidu.com/
写成了 https://wwww.baidu.com/
,改过来就行了。
from urllib.request import urlopen
url = 'https://www.baidu.com/'
response = urlopen(url)
print(response.read())
别用这个旧库了,改用requests吧。
另:百度是3个W,外加https
你设置的百度的域名错了,是这个地址【https://www.baidu.com/】
你设置的百度的域名错了,是【https://www.baidu.com/】