关于python正则表达式中?的用法

import re
>>> content = 'Hello 123456789 Word_This is just a test 666 Test'
>>> result = re.search('(\d+).*?(\d+).*', content)
>>> print(result)
<re.Match object; span=(6, 49), match='123456789 Word_This is just a test 666 Test'>
>>> print(result.group())
123456789 Word_This is just a test 666 Test
>>> print(result.groups())
('123456789', '666')
>>> print(result.group(1))
123456789
>>> print(result.group(2))
666
>>> content1 = 'Hello 123456789 Word_This is just a test 666 Test'
>>> result1 = re.search('(\d+).*(\d+).*', content1)
>>> print(result1.group(1))
123456789
>>> print(result1.group(2))
6

为什么去掉? group只有一个6了。

去掉?则 .* 是贪婪模式,会尽可能匹配更多的字符。

其中 .* 会匹配“ Word_This is just a test 66”

只要留一个6 能让后面的 \d+ 能匹配上就可以。

 

而不去掉?则 .*? 是非贪婪模式,会尽可能匹配更少的字符。

其中 .*? 会匹配“ Word_This is just a test ”

之后的666 都交给后面的 \d+ 来匹配。

 

 

不在于?,是你用的search函数为:re.search()
说明:与match区别在于,match从头开始匹配,一旦字符串开始位置不符合正则表达式就会匹配失败;search匹配整个字符串。

您好,我是有问必答小助手,你的问题已经有小伙伴为您解答了问题,您看下是否解决了您的问题,可以追评进行沟通哦~

如果有您比较满意的答案 / 帮您提供解决思路的答案,可以点击【采纳】按钮,给回答的小伙伴一些鼓励哦~~

ps:问答VIP仅需29元,即可享受5次/月 有问必答服务,了解详情>>>https://vip.csdn.net/askvip?utm_source=1146287632

非常感谢您使用有问必答服务,为了后续更快速的帮您解决问题,现诚邀您参与有问必答体验反馈。您的建议将会运用到我们的产品优化中,希望能得到您的支持与协助!

速戳参与调研>>>https://t.csdnimg.cn/Kf0y