<li data-view="5"><a href="/5.mp3" singer="陈慧琳">记事本</a></li>
需要提取出歌手名和歌名,
歌手名我通过<a href=\"/.*?.mp3\" singer=\"(.*?)\">提取了出来
但是歌名该如何去提取呢?
用正则,然后获取对应组。
#encoding=utf-8
import re
data = '<a href="/5.mp3" singer="陈慧琳">记事本</a>'
regex = '<a.*?singer="(.*?)">(.*?)</a>'
print(re.match(regex,data,re.DOTALL).groups())
为什么要用正则呢,用beautifulsoap模块可以直接把标签读为对象操作