正则表达式的使用问题,求解答

img

img

img
我不知道这个表达式哪错了,但是我把dd后面的.+?去掉就正确匹配,不去的话就像图片那样,不知道这是怎么回事,隔一个数据匹配一个,a标签中的herf也是一样的,获取的属性隔一个取到一个,老哥们帮帮我,我刚开始学爬虫。。。

.+?是匹配一个或多个字符,也就是至少要匹配一个字符
如果是 <dd><a xxxx>
<dd><a xxxx>之间没有其它字符,就匹配不了了
应该改成.*?匹配0个或多个字符