def get_vocab(data,stopword):
tokenized_data = get_tokenized(data,stopword) #分词、去除停用词
counter = collections.Counter([tk for st in tokenized_data for tk in st]) #统计词频
return vocab1.Vocab(counter, min_freq=5,specials=['<pad>','<unk>'])
#保留词频大于5的词 <pad>对应填充项(词典中第0个词) <unk>对应低频词和停止词等未知词(词典中第1个词)
查了网上好像都没有相关的问题。
我遇到和你一样的问题了哥们,你把vocab1.Vocab后面这个换成vocab就行,首字母小写,这两个是不同的函数好像
vocab1.Vocab(counter, min_freq=5,specials=['','']) 你确认有min_freq,这个关键字参数吗,还是这应该是个位置参数