問題のコードを見ています:CUDAカーネルのグリッドとブロックの寸法を選択するにはどうすればよいですか? これは、次の質問からのフォローアップ質問です:CUDAグリッド、ブロック、スレッドサイズを取得し、非正方行列計算を並列化する方法
const int n = 128 * 1024;
int blocksize = 512; // value usually chosen by tuning and hardware constraints
int nblocks = n / nthreads; // value determine by block size and total work
madd<<<nblocks,blocksize>>>mAdd(A,B,C,n);
blocksizeとnthreadsの違いは何ですか?それらは同じものだと思います。これは単なるタイプミスですか、それとも何かが足りないのですか?