总样本是1440,按照70%和30%划分训练和测试集,训练集和测试集的样本数应该是1008和432。但是在随机森林分类的混淆矩阵中,它们的样本数为1007和433。请问为什么会有误差?这属于正常情况吗?
这个不是问题误差的原因可随机抽样有关,在运行几次可能还会有其他的分割结果出现,但都会是在7:3附近