神经网络中的损失去了那里？怎么一步一步更新权值？

神经网络最后得到的损失到底是如何通过一个损失更新如此大量的权值。

每轮训练后，使用该批次的梯度均值更新参数，较快得到接近梯度下降的收敛结果。