
如果通过查找对应的标签来导出图片链接,我需要导出图片中的图片链接,img src
requests获取源码定位到src就行了
一般的爬虫的逻辑是:
- 使用 requests 获取网页 HTML
- 使用 beautifulsoup4 或其他工具解析 HTML
- 找到需要的东西
这个漫画占看着像是用 AJAX 异步加载的,所以获取到的 HTML 是个空壳子,真正的内容是靠 JS 加载的
对于 AJAX 站点,方法大致分两类
- 开浏览器 F12 调试工具分析 Network 记录,找到需要的图片的 URL 等规律,然后写脚本自动爬
- 使用 Chromium driver 等模拟浏览器操作(类似按键精灵)