训练集的损失能够一直下降,但是验证集的损失基本不变
下面这个是使用weight-decay和减小学习率的结果
我用的是pytorch,我以为是过拟合,然后尝试使用dropout并设置为0.2或者0.5发现效果会差很多,而尝试在优化器中使用weightdecay=0.05发现作用不大。
这种情况是过拟合了吗,这个训练充分了吗?