求问大佬们,计算出困惑度是负值是合理的吗,如果困惑度取值图是下面这样的话,选几个主题是合适的呢?
这个要看你选出的主题和你的文本内容是否匹配,抽取样本要验证关键字是否准确,或者用其余的关键字提取方法,将几种方法的提取的关键字做一个交集