利用python进行爬虫爬取视频时,视频为m3u8格式。m3u8格式爬取过程和后续的合并视频都没有问题。
问题是现在需要爬取好多个链接的视频(多个链接是有规律的,可批量进行),不知如何去自动批量获取m3u8的链接,一个一个手动去点击太麻烦。
之前获取m3u8链接的方法是利用chrome的检查工具,在network里抓取视频的链接,批量的话手动去一个一个抓取不现实
有没有方法能够模拟我手动去抓取network里链接这个过程,或者有什么方法能批量获得m3u8地址。如图,三个步骤就可拿到m3u8链接,问题是如何批量实现这个过程,因为需要下载的视频数量太多
链接发一下
你应该用的是selenium或类似的模块吧,页面加载完成后,获取当前页面的源码,根据视频链接的规律,使用正则找出页面上所有的url,然后批量并发下载
能给个视频界面的地址么?我瞅瞅看能不能找到
提供参考链接【如何优雅的批量下载M3U8 格式视频】,期望对你有所帮助:https://www.freesion.com/article/12321406687/
这些ts文件类型的我以前爬取做过,很简单呀,你都能找到批量的链接,先爬取批量的链接,保存到文件,知道不?,然后读取文件发送请求呀,完全不用手动,为了加快效率,完全可以结合多线程
因为m3u8格式的内容每个平台不统一,链接差异很大,正则起来很累,一般不采取爬取链接。
建议用ffmpeg,命令行自动批量识别链接下载合并,
ffmpeg -i https://*****.m3u8 -acodec copy -vcodec copy 1.mp4