Python爬虫api网页不显示信息,报401 You are not authorized to access this resource

网页:


网页页面图片和我代码的图片如下,

img

img

这样的该怎么解决,怎么能把信息爬下来阿,希望大家帮忙解答,

你把你那些不必要的东西删去。直接请求。

一般来说,爬取api接口,需要有身份验证的,在 headers 里,一般有 signure或 author 之类的头信息,用来传递身份信息

经过实际测试,没有需要在头中追加的信息,可直接采集该接口,但是有两个验证

1、必须有cookie _pxhd和vis的信息

2、必须以 http2 的方式访问

from spider import Ajax
ajax = Ajax()
ajax.cookies.set('_pxhd','rmM6TmIl8yxemHh2i5zQ0ukNqAgBZjy-to04Cee/fdi7raneQkXiSC-jVN2nlknweltilES3tHgb234fDCkDCg==:t7xPb-cL616yzC-Wg4pnFEM7fVYDtoXtYGT9aM-oW/kaK2i4Y4/6Fv8TgQ3KnzCf/fxYNmYqtHKvoAVTRvEPV53wblHuBI1aQf-uAuq9YCY=',domain='api.kickstarter.com')
ajax.cookies.set('vis','1ff521ec28268c38-1b45a1957449fe65-ca718e5a781538a3v1',domain='api.kickstarter.com')
r = ajax.Http('https://api.kickstarter.com/v1/projects/503143551/comments?signature=1634786670.0f9e876e76677e6a99c3258c40810d37cd646482&quot',method=Ajax.Method.GET,http=2)
print(r)

我这个测试,用到的Ajax可以参考我的文章