我已经成功迭代2次了,前两个epoch都没问题,在第三次epoch时突然报超出内存请问有朋友知道这是什么情况吗?
请问,您解决了吗,21.43 GiB already allocated; 259.06 MiB free; 21.64 GiB reserved in total by PyTorch,我的更难受
网络太大了GPU带不动,减少模型参数或者batchsize试试
应该是模型太大了 跑过一个网络batchsize设置为1 迭代十几次就爆炸了