数据集划分后进行的预测是长期预测嘛

如果十年数据,划分成7:3的训练集和测试集,那预测模型是预测后三年的数据吗

  • 这个问题的回答你可以参考下: https://ask.csdn.net/questions/7798731
  • 这篇博客也不错, 你可以看下【脑电数据十折交叉验证】实现对数据自动划分训练集与测试集得出平均分类准确率
  • 除此之外, 这篇博客: 【机器学习】决策树案例一:利用决策树进行年龄与音乐类型喜好分类预测中的 利用决策树进行年龄与音乐类型喜好分类预测 部分也许能够解决你的问题, 你可以仔细阅读以下内容或跳转源博客中阅读:

  • 手动反爬虫,禁止转载:原博地址 https://blog.csdn.net/lys_828/article/details/122041951(CSDN博主:Be_melting)

     知识梳理不易,请尊重劳动成果,文章仅发布在CSDN网站上,在其他网站看到该博文均属于未经作者授权的恶意爬取信息
    
  • 您还可以看一下 邱石老师的10分钟实现微信小程序支付功能课程中的 新21~支付成功没有收到回调导致订单状态错误小节, 巩固相关知识点
  • 以下回答由chatgpt基于相关博客总结生成:

    问题: 在数据集划分过程中,预测模型是否适用于进行长期预测?举例来说,如果将一个包含十年数据的数据集按照7:3的比例划分为训练集和测试集,那么预测模型是否适用于预测未来三年的数据?

    回答: 首先需要了解训练集、验证集和测试集的作用,训练集用于建立模型,验证集用于调整模型的超参数,测试集用于评估模型的泛化能力。根据常规做法,应该将未来3年的数据作为validate和test数据集,将过去7年的数据作为train数据集。因为我们希望用已知的历史数据来建立模型,并让模型对未知的未来数据进行预测,为了保证模型能够更好地适应未来的数据,应该使用未来的数据来评估模型的泛化能力。 但如果硬要将已知的历史数据按照7:3的比例划分成训练集和测试集,并用训练集构建模型对测试集进行预测,那么可能会存在过拟合现象,即模型在训练集上表现出色,但在测试集上表现欠佳。这是因为模型建立在训练集上,可能会过度拟合训练集数据的特征,导致无法很好地泛化到未见过的测试集数据。同时,如果测试集数据和训练集数据在时间上没有交集,模型对未来数据的预测能力就可能不足。 因此,建议按照常规做法,将未来的数据集作为验证集和测试集,将过去的数据集作为训练集。根据数据集的不同,在建模过程中可以采用一些特征转换的方法来处理时间序列、连续型和离散型特征,以提高模型的预测能力。具体可以根据实际情况选择合适的特征工程方法,如时间序列中的分离和衍生特征、连续型特征的标准化、归一化和分箱处理、离散型特征的独热编码、顺序编码和平均数编码等等。最后,可以使用一些经典的机器学习模型或深度学习模型进行建模,并通过验证集和测试集的表现来评估其预测能力和泛化能力。如果有需要,可以进一步对模型进行优化和调整,以获得更好的预测结果。