pycharm:K折交叉验证,样本点跟新

使用训练样本点K折交叉验证,令K=5,得到五个模型,所有训练样本点得到1个模型。对候选样本点进行估算,将5个模型与完整数据得到模型结果做差,得到最大值的候选样本点,将其加入下一轮循环,为什么这个点会重复添加进去

在使用K折交叉验证得到多个模型后,对于每个训练样本点,我们只能将其分配给一个模型进行训练和测试。因此,在每个循环中,我们只能将一个模型用于该样本点的估算。

如果在估算候选样本点时,我们将5个模型的结果与完整数据得到模型的结果进行比较,并选择最大值作为候选样本点,那么这个候选样本点很可能会被重复添加到下一轮循环中。

这是因为我们只考虑了5个模型中的最大值,而没有考虑到其他模型的结果。如果这个候选样本点在多个模型中都得到了较大的预测值,那么它很可能会被多次选择为候选样本点,并在多个循环中被添加到数据集中。

因此,为了避免重复添加候选样本点,我们需要对每个模型的结果进行综合考虑,而不是只考虑最大值。可以使用平均值、中位数或其他指标来综合多个模型的结果,并根据这些指标来选择候选样本点。这样可以减少重复添加候选样本点的可能性,并提高算法的效率和准确性。