MXNet使用GPU计算,在将NDArray存储在显存的时候,python内核一直在忙,不给出结果,这是什么情况?

目前在学《动手学深度学习》。
其中有一节是讲的GPU计算,前面的步骤很顺利,到了将NDArray存储到显存的时候,内核就一直忙碌不给出结果。
如果存在主存,也就mx=cpu()的时候没什么问题,只有当mx=gpu()的时候内核会一直忙碌不给出结果,连error也不报,我都不知道哪里出了问题😭😭😭😭
显卡是RTX4060,CUDA的版本是12.2,MXNet-cuda是安装的10.2。

img

img


如上图,很久不给出结果,是mxnet-cuda版本问题吗?

不好意思了xdm,特么的跑出来了,就是太慢了。