图像识别,输入特征图放大一倍导致loss震荡不收敛

同一数据集,同一模型结构,同一超参数,当我输入尺寸为512×512的时候获得了一个还算不错的结果,但是当我把输入改为1024×1024时(除了batch调小,其他完全不变),模型loss剧烈震荡完全不收敛。

为了把问题描述清楚一些,就是我现在在做一个目标检测的开源项目,用的ssd,我现在只关注小目标的前提下,必须增大第一个ssdhead所接收到的特征图尺寸,以此来减小对应原图上候选框的尺寸。

问一下老师们,一般当遇到加大特征图输入尺寸以获得更好效果的这种问题时,我该怎么调节网络结构?深度?宽度?还是其他?
非常感谢

输入大了四倍,其他卷积核数量、大小应该相应的调整,甚至可以考虑空洞卷积或怎加pooling、bn层等,减少一些多余信息,去除不必要的特征信息

小目标考虑下FPN目标检测