调用多项式回归模型,预测结果有问题

用python训练好并保存了几个多项式回归模型文件,调用时只有两个模型文件可以作预测使用,其它的文件加载时输出结果相同且和实际值相差较大。请问是什么原因导致的部分文件出错?

可能是由于训练数据不足,或者模型过于复杂,导致出现过拟合现象,也就是所谓的欠拟合,从而使得模型对于新数据的预测准确率不高。

可能是由于模型在训练过程中出现了过拟合现象。过拟合指的是模型在训练集上表现很好,但是在测试集上表现很差,出现了泛化能力不足的情况。在训练过程中,如果模型的复杂度过高,可能会导致过拟合。在这种情况下,模型会在训练集上表现很好,但是在未知数据上的表现可能会很差。

为了避免过拟合,可以采用一些方法,例如增加数据量,减小模型复杂度,使用正则化等方法。另外,还可以采用交叉验证的方法,来对模型的泛化能力进行评估和优化。

如果模型已经出现了过拟合现象,可以采用一些方法进行调整,例如调整模型复杂度,采用正则化方法,增加数据量等等。

通常的多项式拟合,可以存在以下几种问题:
1、对过去的拟合效果较好,插入数值也很满意,但对未来的预测存在问题。这个问题来源是,你需要预测的时序性系统是决定性系统还是非决定系统?对于决定性系统,多项式拟合可以有近似逼近的预测意义,但同时需要增加数据以及迭代当下数据以逼近现实。也就是预测方程实际是通过迭代最新数据而发生改变的,而并不是唯一性的不变的方程。而对于非决定性系统,不管历史数据拟合的如何美妙,预测未来可能都会出现问题。例如具有分形迭代特征的混沌系统(如股市)、以及随机系统、还有有人为影响因素的系统(人为可以改变、影响规律的系统,股市也有人为影响因素)。这种系统,多项式拟合这种方法并不适合预测。因为系统本身有非线性的因素。
2、过拟合或欠拟合的问题。通过实验,对于决定性系统,我发现往往四次方程相对适中。尽管拟合曲线并不是很圆满。五次方程就开始存在过拟合的问题,导致预测结果出现问题。如果上百次的方程,过拟合问题会导致预测结果毫无应用意义。
3、既然你说训练了,可能利用了机器学习等方法,最终形成了拟合方程。但是,机器学习、神经网络等方法依然是基于阈值、条件性等因素的决定性方法,并不能完全解决“1”中说到的问题。面对混沌、随机系统,依然会出问题。使用动态迭代性数据的逼近拟合会缓解问题,但是却会使未来变成一个区域范围,而不是点、线意义的。并且预测结果的时间范围必须约束,时间太远,预测模型依然失效。