用梯度下降法优化损失函数,其损失函数是由循环产生,再用Spyder运行当中,其运行的非常慢,感觉进入了死循环
损失函数本来都是循环,无论是mse mae crossentropy...,但是关优化算法(反向传播算法)什么事呢。很慢就应该用gpu去加速啊,sgd要设置学习率、动量