import re
findPshu = ['票数:294\xa0\xa0 ','票数:294\xa0\xa0 ','票数:294\xa0\xa0 ']
print(findPshu)
findPshu = [re.sub(r'([\s\t\u00a0 ]| | )','',n) for n in findPshu]
print(findPshu)
---
['票数:294\xa0\xa0 ', '票数:294\xa0\xa0 ', '票数:294\xa0\xa0 ']
['票数:294', '票数:294', '票数:294']
已我多年的采集经验来看,基本上所有空格都在这个正则里了,包括全角,半角的,英系的,html定义的,unicode的
import re
def remove(string):
pattern = re.compile(r'\s+');
return re.sub(pattern,'', string);
string = 'P y t h o n';
print("原字符串:"+string);
print("\n新字符串:"+remove(string)) ;
您好,我是有问必答小助手,您的问题已经有小伙伴解答了,您看下是否解决,可以追评进行沟通哦~
如果有您比较满意的答案 / 帮您提供解决思路的答案,可以点击【采纳】按钮,给回答的小伙伴一些鼓励哦~~
ps:问答VIP仅需29元,即可享受5次/月 有问必答服务,了解详情>>>https://vip.csdn.net/askvip?utm_source=1146287632