Python英语文本分析怎么匹配不同时态的单词

如题,想做用四六级➕3500匹配hp原著的分析,到单词都是原型,原文都是特殊形态,这样处理不了,求指教

可以安装第三方分词模块,比如nltk可以实现规则动词的时态原型转换。下面是用法,打印出going的原型go

from nltk.stem import SnowballStemmer
trans = SnowballStemmer('english')
# 下面可以分析规则变形的谓语动词
a = trans.stem('going')
print(a)

但是对go/went/gone这种不规则变化就无能为力了。可以自己创建本地字典,把不规则变形的词放在一起。