神经网络使用不同的损失函数,找到的最优解会不会不同?

神经网络使用不同的损失函数,找到的最优解会不会不同?
误差曲面中最低点是同一个吗?

肯定会不同。
比如说有时候,疾病诊断,误把有病当作没有病后果很严重,但是误把没有病当作有病后果不严重,就要在损失函数里给前一种更大的惩罚项。

不同的损失函数,某些情况下,找到的最优解是不同的
比如,在目标检测时,损失函数是由物体的识别概率及方框的额偏移量两部分构成,不同的误差损失权重,可以看作是不同的损失函数了已经。
如果你重视物体的识别率,那么可以加大识别误差损失的权重,
如果你重视方框的准确率,那么可以加大方框的识别误差的权重,
又比如我们常用的绝对值损失函数及平方损失函数,交叉熵损失函数。他们的最优解是相同的,都是当真实值与预测值完全相同的情况下,误差曲面达到最低点。
但是即使他们想要求的最低点时同一个,但大多数都是只能在最低点处徘徊,而好的损失函数,会更快,更加逼近最低点。