python+机器学习情感分析：为什么取高信息量特征之后，算法的准确率反而比没取之前的低？

代码参考http://f.dataguru.cn/thread-713072-1-1.html

使用卡方统计对单个词、双词、单双词配合特征计算信息量后，选取高信息量的特征进行训练，但是训练出来的准确率比没统计之前的还要低，这是为啥??

一个是特征选的不够好。还有就是训练数据和测试数据差别很大。模型不够准确