python 正则豆瓣电影排行问题

用Python 正则爬豆瓣评分排名前250电影,遇到一个问题:第209部电影爬取导演信息失败。

https://movie.douban.com/top250?start=200&filter=

img

我看了一下网页源代码,发现一个问题,第209部电影的导演字段和其它电影的都不一样,其它电影都是以 结尾,但是这个电影是以..
结尾。见截图:以下是正常情况,

img

下面是异常情况:

img

这是我的正则:

img

目前250部电影就只发现了这一个case爬不下来,请问各位,有没有好的正则方法可以同时捞出 第209和其他电影。感谢~

使用管道符呢?(&nbsp|\.{3})

你好,可以参考我这篇博客,很好的解决了你所提到的问题!https://www.cnblogs.com/yqPhare/p/14174146.html