爬虫的时候正则匹配不明白咋办,完全相同的东西多了不会弄,不一样的多了也不会弄= =

一、有超过一个完全相同的,正则无法正确匹配

img


二、分类中有格式不一样的内容,正则无法正确匹配
就好比一个电影网站,他两个电影的网页设计不完全一样

建议直接用bs4定位a标签获取数据比较好