<td class="abcde:0:no_22" style=";"><center>需要提取的内容1</center>
<td class="abcde:1:no_22" style="white;"><center>需要提取的内容2</center>
<td class="abcde:2:no_22" style="blue;"><center>需要提取的内容3</center>
其中abcd:后面的是序号,no_22是必须保留的特征字符,不能直接用center,有一百多个center,序号倒是通过跳过不匹配了,但是style参数也是不定的。
#这是目前使用条件,在运行过程中报错,发现style导致报错
res = re.findall(r':no_22" style="white;"><center>(.*?)</center>',txt)
请问以上怎么提取出所有“需提取的内容X”
import re
data = """
<td class="abcde:0:no_22" style=";"><center>需要提取的内容1</center>
<td class="abcde:1:no_22" style="white;"><center>需要提取的内容2</center>
<td class="abcde:2:no_22" style="blue;"><center>需要提取的内容3</center>"""
print(re.findall("""no_22" style="white;"><center>(.*?)</center>""",data,re.M))
print(re.findall("""no_22" style=".*?;"><center>(.*?)</center>""",data,re.M))
t ='''<td class="abcde:0:no_22" style=";"><center>需要提取的内容1</center>
<td class="abcde:1:no_22" style="white;"><center>需要提取的内容2</center>
<td class="abcde:2:no_22" style="blue;"><center>需要提取的内容3</center>
'''
import re
res = re.findall('no_22\" style.*<center>(.*)</center>',t)
print(res)