python利用jieba分词出现乱码问题，求指教

用一段新闻作分词，先用正则表达式去除标点符号re.sub(r,'',pos_news[0]),其中pos_news[0]是一段新闻。
print 之后是去除标点的一段新闻。
print " ".join(jieba.cut(re.sub(r,'',pos_news[0])))打出来乱码：
涵閬涓婁簡杩欎唤鐙壒鐨勭ょ墿濞绀句氬悇鐣鍟璧蜂簡搴鐑堢殑鍙

但是如果直接print " ".join(jieba.cut(pos_news[0])) 是正常的分词后的新闻
“ 我经常和孩子们说，要记住每一个帮助过我们的人，日后有能力了要记得报答人家！ ” 走访结束后，赵继（化名）母亲的话依然在 e 租宝志愿者的耳畔回绕。

不知道为什么我去除标点后分词就是乱码。。。NLP小白求指教！

先要看看你的编码是什么，你需要对应的解码，decode等。

with open('19th.txt', 'r', encoding='utf-8', errors='ignore') as f:
data = f.read()
用这个来解码encoding='utf-8'