以前の投稿で説明したように: CUDAで利用可能な最大スレッド数を見つける方法は? GPUカードのスレッドの最大数は21504であることがわかりました。ただし、それ以上の数をカーネルに割り当てると、すべてがスムーズに実行されます。
#include <stdio.h>
#include <cuda_runtime.h>
__global__ void dummy()
{
}
int main()
{
//int N=21504;
int N=21504*40;
dummy<<<1,N>>>();
return 0;
}
何が起こったのかはわかりませんが、これは避けたほうがいいと思います。