利用gensim在做LDA主题模型的时候,先根据一致性和困惑都确定主题数,但是数据量太大了(十多万条),内存不够,一致性运行不出来,该怎么办,可以使用多线程吗,或者还有其他什么办法呢?
你目前是多少内存?问题解决了吗?
分批次运行,或者取数据集中一部分先试试