python+机器学习情感分析:为什么取高信息量特征之后,算法的准确率反而比没取之前的低?

代码参考http://f.dataguru.cn/thread-713072-1-1.html

使用卡方统计对单个词、双词、单双词配合特征计算信息量后,选取高信息量的特征进行训练,但是训练出来的准确率比没统计之前的还要低,这是为啥??

一个是特征选的不够好。还有就是训练数据和测试数据差别很大。模型不够准确