如题,爬取某文库,抓包时发现其预览与响应的内容并不一致。第一次遇到这种状况,求解。预览中有四项:body,front,page,style,如图:
现在大部分网站是后期加载內容,直接爬取不能爬到完整东西,要用例如 selenium 去模拟才行,我主页上周有个文章关于 java selenium,可以参考一下