第3行缺少参数,应该提供LDA模型的topic-term分布和单词列表。
第4行多了一个pyLDAvis.shov(pic)函数调用,可能会导致语法错误。
第5行没有传递参数到pyLDAvis.show()函数中。
这里作者用多维尺度分析,提取出主成分做维度,将主题分布到这两个维度上,主题相互之间的位置远近,就表达了主题之间的接近性。气泡距离采用的是
JSD距离,(应该)可认为是主题间的差异度,气泡有重叠说明这两个话题里的特征词有交叉。知道这些后,就是看词说话了。看看这些词应该是在说些什么东西,提炼出不同的topic来,这才是有实际应用价值的结果。若无最后的结果输出,前面所做的一切都是废纸一张。
先总结到这里吧,抛去理论层面,应该是够用了。