我有一些特征数很多但是总体样本数量很少的训练数据:维度18训练集共17条数据
想用深度学习去进行预测,目前用到的是lstm 就像多变量风速预测一样。
但是数据量太少了。。结果太差了,导师给了篇参考叫非均衡数据的层次学习,,但我觉得没有用。或许有可以帮忙分析解决一下吗
18维向量17条数据,别说深度学习了,机器学习都无法解决,会产生严重的过拟合,后果就是模型没有任何实际意义。我的建议首先是考虑降维,LDA、PCA模型等把无关紧要的特征先删掉,然后想办法补充数据集。至于你说的非均衡数据处理,也是基于一定的样本容量进行的,比如100个样本,70个正例、30个反例,这时候可以采用均衡化。
如有帮助请采纳,欢迎追问