Java使用webmagic技术爬取网页信息时只有空head和body标签

先上图:(再声明一下属于我可没非法爬取哈— —!怕吃违法人员国家统一招待饭)

问题:在使用Java爬取爬取网页源码要分析时只返回空的<body><head>标签

怀疑:感觉是由于这一串贼长的标签原因

查询原因:我在自己测试时,以为是动态加载页面,所以就是用了selenium进行加载获取,同时使用花瓣网对比下正常网页和动态加载的区别(因为这个网页是异步加载的),所以在测试的时候,使用Jsoup获取网页源码只能加载一点点,而在使用selenium的时候确实等将动态加载的花瓣网源码都能加载出来。但是在使用selenium加载 “目标网页” 时,却只能加载出空的head和body标签。后面一搜感觉好像是说“反爬”,因为不太了解爬虫然后想知道下怎么知道一个网页是否支持“反爬”呢?后面看了下目标网页的源码,发现每次进F12都会进入debugger,源码中有如图上一串|贼长|的标签里面又放的js啥的

实在没法子来询问下各位大佬这个问题的原因以及一个解决方案,我就想获取到目标网页的源码后使用进行xpath分析

不知道你这个问题是否已经解决, 如果还没有解决的话:

如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 以帮助更多的人 ^-^