python中文文本分类使用朴素贝叶斯分类器,得到的训练词向量的维数在多少比较合适?

最近在学习中文文本分类,自己从网上抓取的新闻文本,可是就算是同一主题下的文本得到的
词向量的维数也有800+,是文本数太少了吗?还是这是正常值?

不知道你这个问题是否已经解决, 如果还没有解决的话:

如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 以帮助更多的人 ^-^