深度机器学习的数据集为什么一定要2万以上的样本?如果我现在有2千的样本,并且我的测试集是600,测试集上准确率已达到85%了,但是传统的机器学习分类才82%, 如果这样的话。难道我不能用深度机器学习模型吗?
个人理解,不同的场景与精度,可以不要这么多,真实现场需要,2万以上的应该不多的,
好像没有规定深度学习的数据集必须大于多少,只要训练出来的网络能在测试集上有好的效果就行。不同方向的训练可以用不同的数据集,有些数据集没有很多数据,但训练完成后性能也不错。只要效果好,就可以用。
我也是这么想的,不过为什么老是有人说2万和5万以上的数据集才能用深度学习。不然就是怀疑结果有问题。但是其实我的数据集才1600多条应用深度学习比传统的机器学习效果还好。我就像知道她们所谓的2万和5万是根据什么得来的。不管是老师还是评委都有这么说过。