请问 loss的绝对值在50轮以前一直下降,在50-100轮上升,后面又继续下降 这是正常的吗,如果不正常的话,一般问题出现在什么地方呢?
至于问题的定位排查,建议按照先易后难的角度,也就是先排查训练集和测试集是否存在数据域的不同,再排查模型是否过拟合。
1.关于数据域的排查
具体来讲就是查验训练集和测试集的数据分布不一致,具体来说有如下几点
(1)数据源分布不一样:例如在图像处理中,训练集的图像采集使用的是摄像头A拍摄的,而测试集是摄像头B拍摄的,但是摄像头A和B的拍摄效果差别较大(例如:图像成图的清晰度、对比度等);在语音识别中,训练集是音频普通话较多,测试集却很多方言;
(2)数据集的噪声干扰不同:例如在图像中,训练集的图像都是正常拍摄,但是测试集的图像都是昏暗的或遮挡的;在语音识别中,训练集可能都是清晰的音频,测试集却有很多背景杂音等。
2.关于过拟合的排查
如果不是数据域的问题,那么可以基本判定训练集和测试集的数据域是一致的。那么问题可以归为模型过拟合。