Python 文本处理从网页上面复制粘贴的txt文件，怎么去除\u3000和\n

如图上显示的，
我按照这个网站(https://zhuanlan.zhihu.com/p/348461462) 的方法试了一下，还是这样子，是不是漏掉了那一步没做?

你 s = str(f.readlines()) 是对列表进行字符串格式化,\u3000成了6个字符的字符串，不是一个空格了。
 
在正则中 \ 就要写两个, 改成 \\
re.sub(r'\\u3000','',s)

或者
s = str(f.readlines())
改成
s = f.read()
就可以用re.sub(r'\u3000','',s)了

如有帮助，望采纳！谢谢!

使用 res=[x.strip() for x in data]
或者 re.sub('\s+','')

a=['\u3000\u3000我们\n']
res=[]
import re
for s in a:
    res.append(s.strip())
    #或者
    res.append(re.sub('\s+','',s))
print(res)

如有帮助，请点采纳。

用data.decode('unicode-escape').encode('utf-8')这方式转码试试

Python 文本处理 从网页上面复制粘贴的txt文件，怎么去除\u3000和\n

Python 文本处理从网页上面复制粘贴的txt文件，怎么去除\u3000和\n