用深度学习做二分类问题时,训练集精度很高,测试集精度就很低,差15%,是为什么呢?
两个集合分布差异太大,可以对训练集做一些数据增强。
比较常见的原因其实就是训练集和测试集的分布不一样。解决方法可以试下加数据增强,让模型的鲁棒性更强,还有就是可以尝试用迁移学习方法。
1、一般是数据样本太少,导致训练样本代表性不足,最好的解决方法是增加训练集,
2、如果是时间序列的数据,前后的数据差距较大,用前面的训练后面的测试,必然误差大,如果数据有周期性,至少选择一个周期的训练,效果就会好很多
3、存在过拟合现象,解决的方法就行降低训练期望,测试准确率反而会提高