Python在input打出"我",就能出现"你,他,你们,我们,他们,他们的,七大姑八大姨",涉及自然语言词汇的整理,怎么做?
这个可以考虑下载一个腾讯800万中文词向量,开源的,网上就有,下载完成后。用annoy建立索引库,annoy里支持的是最大近似近邻算法,由于腾讯的词向量本身是大量语料训练出来的,相近词的词向量距离近,所以通过词向量+annoy这种方式,输入一个词就能得到相近的其他词了。
好像不能,input要回车确认才能开始处理。估计要重写input
傻瓜式操作:把 你,他,你们,我们,他们,他们的,七大姑八大姨 都先列举了 输入 你 之后遍历