html = '<tr>
<td>#1</td>
<td>Princeton</td>
<td>Princeton University</td>
<td>NJ</td>
<td>$53,890</td>
<td>5,422</td>
</tr>'
pattern = re.compile(r' <tr><td>#(\d+)</td><td>(.*?)</td><td>(.*?)</td><td>(.*?)</td>', re.S)
items = re.findall(pattern, html)
print(items)
import re
html = '''<tr>
<td>#1</td>
<td>Princeton</td>
<td>Princeton University</td>
<td>NJ</td>
<td>$53,890</td>
<td>5,422</td>
</tr>'''
pattern = re.compile(r'<tr>\s*<td>\s*#(\d+)\s*</td>\s*<td>\s*(.*?)\s*</td>\s*<td>\s*(.*?)\s*</td>\s*<td>\s*(.*?)\s*</td>', re.S)
items = re.findall(pattern, html)
print(items)
你想获取什么数值?程序运行中遇到了什么问题?另外代码中多行字符串用三单引号,或三双引号。pattern = re.compile(r'<td>(.*?)</td>', re.S)匹配td标签下的所有内容。
您好,我是有问必答小助手,你的问题已经有小伙伴为您解答了问题,您看下是否解决了您的问题,可以追评进行沟通哦~
如果有您比较满意的答案 / 帮您提供解决思路的答案,可以点击【采纳】按钮,给回答的小伙伴一些鼓励哦~~
ps:问答VIP仅需29元,即可享受5次/月 有问必答服务,了解详情>>>https://vip.csdn.net/askvip?utm_source=1146287632