我不知道这个表达式哪错了,但是我把dd后面的.+?去掉就正确匹配,不去的话就像图片那样,不知道这是怎么回事,隔一个数据匹配一个,a标签中的herf也是一样的,获取的属性隔一个取到一个,老哥们帮帮我,我刚开始学爬虫。。。
.+?是匹配一个或多个字符,也就是至少要匹配一个字符 如果是 <dd><a xxxx> <dd>与<a xxxx>之间没有其它字符,就匹配不了了 应该改成.*?匹配0个或多个字符