运行代码时会出现
(unicode error) 'unicodeescape' codec can't decode bytes inposition 2-3: truncated \UXXXXXXXX escape
报错。请问该如何解决呢?
def keben():
txt=open("C:\Users\cpy\Desktop\ceshikeben.txt","r").read()
txt=txt.lower()
for ch in '!"#$%&()*+,-./:;<=>?@[]^_‘{|}~':
txt=txt.replace(ch,"")
return txt
#用于去除英文课文文本中的特殊字符,并用空格隔开其中的单词。
def zhongdian():
txt=open("C:\Users\cpy\Desktop\ceshizhongdian.txt","r").read()
txt=txt.lower()
for ch in '!"#$%&()*+,-./:;<=>?@[]^_‘{|}~':
txt=txt.replace(ch,"")
return txt
#此函数用来去除 重点单词文本中单词间的特殊符号,使其用空格隔开。
a=keben()
b=zhongdian()
zhongdian=b.split()
dic={}
c=list()
d=len(zhongdian)
for item in zhongdian:
dic[item]=a.count(item)
dic = dict(sorted(dic.items(), key=lambda x: x[1], reverse=True))
print(dic)
能正常运行该程序
在读取文件的时候注意反斜线会被Python误认为转义。在文件路径前加个小写字母 r 试试
txt=open(r"C:\Users\cpy\Desktop\ceshikeben.txt","r").read()
另外如果遇到转码的问题,再加个参数encoding='utf-8'