有10个月的商品销量,训练,验证,测试打算6:2:2
时间序列有高度的自相关性,所以我不能随机打乱。
如果1-6月训练,7、8验证,9、10测试的话,实验结果表明测试精度远差于验证集逻辑上很好解释,中间差了两个月,市场行情发生了很大的变化,模型没见过跟不上了。
能否把7、8作为测试,9、10作为验证,这样有没有科学性?
如果9、10继续做测试集,那参数确定后能不能把7、8两个月的数据吃进模型?
建议你随机从每个月抽取数据。
“序列有高度的自相关性,所以我不能随机打乱。”
没关系,你只要保证学习序列的完整,而不需要保证样本的完整。
比如说,你学习7个步,就是连续的7天
你可以先得到如下数据
30号~5号
31号~6号
1号~7号
2号~8号
3号~8号
...
然后从中随机抽取一些,作为训练,一些作为测试。