爬取下来的图片被分块了,找不到思路

https://www.cmoa.jp/title/193356/vol/1/ 这是网站。


各位大神遇到这种情况应该怎么爬,没一点思路。


怎么能够爬取完整的图片,而不是这种分块的图片。如果自己写算法,那太麻烦了,没意义。

抓取的哪部分的图片啊?

从开发工具看一眼 如果网站本身就是分块的图片 你抓取肯定也是分块的 只能先下载然后自己再合并

这种漫画网站是为了防盗,原始加载的图片本身就是分块打乱的。

他是在加载图片到页面中之后再读取一个分块还原顺序的数组。用js和css来还原显示到页面上。


所以你也只能找到这个分块还原顺序的数组来自己写算法了。


@天际的海浪 恩,是的。他这个排列的数组找了好久找不到,应该是有方法怎么找的吧。

或者用selenium 打开网站进行截图

https://cloud.tencent.com/developer/article/1508608


要是你来爬取他整个网站的漫画资源,你会怎么操作呢。能行的通的思路就行,我可能进入了死循环,希望大神能说下自己的见解,我学习下。

使用phantomJS、selenium、pupeteer之类的无界面的浏览器

自动化操作打开页面 然后渲染成图片或者PDF

他在浏览器页面中显示时图片肯定是拼好的。

我做的话就是用selenium 打开网站然后对浏览器自动进行截图,保存成图片。

https://www.cmoa.jp/title/193356/vol/1/ 这个打不卡嘛?

有墙?