求大神解答,用梯度下降法优化损失函数,损失函数可以由循环产生吗?

用梯度下降法优化损失函数,其损失函数是由循环产生,再用Spyder运行当中,
其运行的非常慢,感觉进入了死循环

损失函数本来都是循环,无论是mse mae crossentropy...,但是关优化算法(反向传播算法)什么事呢。很慢就应该用gpu去加速啊,sgd要设置学习率、动量