选取NLTK语料库中的某个类别,统计给定单词出现的频率;然后统计该词在该语料库的不同类别文体中出现的频率。

4.3选取NLTK语料库中的某个类别,统计给定单词出现的频率;然后统计该词在该语料库的不同类别文体中出现的频率。

固定搭配可以使用后缀数组 https://blog.csdn.net/qq_37774171/article/details/81776029
是中文还是英文,中文的话,便利一遍存入以词汇为key的字典,统计每个字符的频率再排序