我用python爬取网页,为什么会有一部分数据丢失了

img

img
爬取下来的直接从云中君开始了,前面几条li丢失了,这是为什么呢

没问题的,因为他本身返回的就是从云中君开始的

img

你打开查看源代码就知道了

你看下他的这个: http://pvp.qq.com/web201605/js/herolist.json http://pvp.qq.com/web201605/js/herolist.json 这个就包含了你前面的那13个人物

应该反爬了,你将你的响应内容输出看看再分析,,最好加上请求头试试

有可能是你要的数据不在网页源代码里面,你看看开发者工具里面的代码和你的网页的代码一不一样,因为有些网站的元素是服务器端临时发送给客服端的,不会提前放在源代码里面,有用的话点一下采纳

https://link.csdn.net/?target=http://pvp.qq.com/web201605/js/herolist.json https://link.csdn.net/?target=http://pvp.qq.com/web201605/js/herolist.json
你这样用这个爬不完美的,你会发现里面的一些皮肤没有的,比如李白,东方曜