提问
jieba分词我想保留连续的”适得其反”这个词,
但是结果出来老是断成【适得 其反】,该怎么在下面的代码里写
# encoding=utf-8
# 分词模式介绍
import jieba
seg_list = jieba.cut("我来到北京清华大学", cut_all=True)
print("Full Mode: " + "/ ".join(seg_list)) # 全模式
seg_list = jieba.cut("我来到北京清华大学", cut_all=False)
print("Default Mode: " + "/ ".join(seg_list)) # 精确模式
seg_list = jieba.cut("他来到了网易杭研大厦") # 默认是精确模式
print(", ".join(seg_list))
seg_list = jieba.cut_for_search("小明硕士毕业于中国科学院计算所,后在日本京都大学深造") # 搜索引擎模式
print(", ".join(seg_list))
type(seg_list)
输出结果如下
word1=""
word2=""
for word in words:
word1=word2
word2=word
if word2=="适得":
pass
elif word1=="适得" and word2=="其反":
words_ls.append(“适得其反”)
else:
words_ls.append(word)
在代码中使用 jieba.load_userdict()
函数加载自定义词典,代码示例如下:
import jieba
# 加载自定义词典
jieba.load_userdict('适得其反')
# 输入文本进行分词
text = '适得其反的结果往往是事与愿违'
words = jieba.cut(text)
# 输出分词结果
print('/'.join(words))
运行结果如下:
适得其反/的/结果/往往/是/事与愿违
如果以上回答对您有所帮助,点击一下采纳该答案~谢谢