pytorch1.10版本训练结果很差

在一个一模一样的代码中,我尝试了多次,用不同的pytorch版本训练,最后发现,在1.10版本开始,结果就很不一样,如果正常的是一次迭代就就可以把损失降到3,但是1.10版本一直都是很高的损失,代码一模一样,并且设置了我们的随机种子等参数,还是如此

这挺神奇啊.
网络初始化等参数都一样吗...
猜测:可能是不同版本的一些默认的设置不一样

请问现在有什么解决的办法吗