神经网络使用不同的损失函数，找到的最优解会不会不同？

神经网络使用不同的损失函数，找到的最优解会不会不同？
误差曲面中最低点是同一个吗？

肯定会不同。
比如说有时候，疾病诊断，误把有病当作没有病后果很严重，但是误把没有病当作有病后果不严重，就要在损失函数里给前一种更大的惩罚项。

不同的损失函数，某些情况下，找到的最优解是不同的
比如，在目标检测时，损失函数是由物体的识别概率及方框的额偏移量两部分构成，不同的误差损失权重，可以看作是不同的损失函数了已经。
如果你重视物体的识别率，那么可以加大识别误差损失的权重，
如果你重视方框的准确率，那么可以加大方框的识别误差的权重，
又比如我们常用的绝对值损失函数及平方损失函数，交叉熵损失函数。他们的最优解是相同的，都是当真实值与预测值完全相同的情况下，误差曲面达到最低点。
但是即使他们想要求的最低点时同一个，但大多数都是只能在最低点处徘徊，而好的损失函数，会更快，更加逼近最低点。