如图上显示的,
我按照这个网站(https://zhuanlan.zhihu.com/p/348461462) 的方法试了一下,还是这样子,是不是漏掉了那一步没做?
你 s = str(f.readlines()) 是对列表进行字符串格式化,\u3000成了6个字符的字符串,不是一个空格了。
在正则中 \ 就要写两个, 改成 \\
re.sub(r'\\u3000','',s)
或者
s = str(f.readlines())
改成
s = f.read()
就可以用re.sub(r'\u3000','',s)了
如有帮助,望采纳!谢谢!
使用 res=[x.strip() for x in data]
或者 re.sub('\s+','')
a=['\u3000\u3000我们\n']
res=[]
import re
for s in a:
res.append(s.strip())
#或者
res.append(re.sub('\s+','',s))
print(res)
如有帮助,请点采纳。
用data.decode('unicode-escape').encode('utf-8')这方式转码试试