爬虫问题!在爬古诗文网登录的时候报错500,有时候能爬到,但大多数请求报下面的错误!

爬的是古诗文网

img

img

img


其中有几次改了hide元素里面标签爬到了 但是到后面又爬不了了
出现的错误代码一直都是500,表单里面的数据是邮箱和密码还有验证码,验证码没问题,好像还有个hide一直是变动的。

img


这是传的表单数据,是不是还要写个函数去获取这个viewstate。每次刷新登录网站时候这个的值也一直是刷新的。

viewstate是asp.net的状态信息,应该先获取登陆页面的viewstate数据和相关的cookie信息,然后同时发送获取到的cookie和viewstate和数据到接口。
requests cookie参考
https://www.cnblogs.com/xiaoxi-3-/p/7586072.html