pytorch1.10版本训练结果很差

在一个一模一样的代码中，我尝试了多次，用不同的pytorch版本训练，最后发现，在1.10版本开始，结果就很不一样，如果正常的是一次迭代就就可以把损失降到3，但是1.10版本一直都是很高的损失，代码一模一样，并且设置了我们的随机种子等参数，还是如此

这挺神奇啊.
网络初始化等参数都一样吗...
猜测：可能是不同版本的一些默认的设置不一样

请问现在有什么解决的办法吗