抓取图片正则表达式为r'src="(.+?.(?:bmp|jpg|png|gif))"'问下大神们,为什么抓取时不会将src=抓取进去,而只是抓取了括号里内容?(?:)是非捕获型括号吗?为什么直接用捕获型会多出.jpg类的字符?
src只用来匹配而已,没有包含进捕获结果。你可以用括号把src也一起包含进来
https://www.crummy.com/software/BeautifulSoup/bs4/doc.zh/
可以试试这个库,很好用.