cuda编程中,一个核函数可以最多运行多少个thread

GEForce RTX3060 配置如下:
28个流处理器, 每个SM最多运行1536个TH read 那么一个kernel 最多为可以运行43008

此外 vs中测试的网格MAX数目(maxGridSize)在三个纬度下是(2147483647 65535 ~)为啥每个grid分配这么多的块 一个核函到底用threa d 的数量是几

在我的程序中 使用此显卡 并行处理27万个单元 最大了 即每个线程处理一个单元,为什么处理这么多 和最大的Thread数不一致 原因为何

大家见谅,表述可能不清楚,因为内容不让重复,有疑问欢迎留言!

CUDA-Thread
https://wenku.baidu.com/view/c3da123e2179168884868762caaedd3383c4b57a.html

您好,我是有问必答小助手,您的问题已经有小伙伴帮您解答,感谢您对有问必答的支持与关注!
PS:问答VIP年卡 【限时加赠:IT技术图书免费领】,了解详情>>> https://vip.csdn.net/askvip?utm_source=1146287632