上图1是对时间序列不打乱直接按顺序分为训练集和测试集,图2是打乱的时间顺序。不明白为什么打乱的测试的结果就是很正常,不打乱就几乎没有拟合效果……
这道理很简单,时间序列的每一部分都不包括远处别的部分数据变化的规律。打散的数据能使你的训练“见识到”更多不同的规律。
插值和拟合都是要根据一组数据构造一个函数作为近似,由于近似的要求不同,二者的数学方法上是完全不同的。而面对一个实际问题,究竟应该用插值还是拟合,有时容易确定,有时则并不明显。