如图一,想利用爬虫爬取学校图书馆预约空间的时时信息。
headers参数不全,你按照浏览器开发者模式里面的,把需要的都加上,可能就行了。
还有另外一种方法,就是你直接用 selinum来进行模拟访问,然后进行爬取就可以了。
这个是api接口,需要带上验证的参数吧,比如cookies
【相关推荐】
question: 为什么我们编写爬虫就可以获取网页里的各种数据,代码 ?
我们使用浏览器上网,来获取网页,从而来获得我们想要的内容,
而我们编写爬虫,其实就是模拟浏览器上网,来获取网页中我们想要的内容。