最近在做一个项目,其中有一块功能是把QQ群里的相册评论导出来,接到这个任务感觉很茫然,该怎么做呢?从哪下手呢?请大神指点
使用cookie登录网页版相册,然后爬取对应网页的源码,对该源码进行正则表达式匹配过滤即可。
我可以问一个问题吗?要是按照一楼二楼的说法,要是评论太多的话,不止一页。企不是要每一页都要重复操作?