私は CUDA が初めてで、カーネル呼び出しと混同しています。
カーネル メソッドを呼び出すときは、この kernelMethod<<< block, Threads >>>(parameters); のように、ブロック数とブロックごとのスレッドを指定します。"
では、なぜ 3 番目のパラメーターを使用できるのでしょうか。kernelMethod<<< ブロック、スレッド、???>>>(パラメータ);
cudaDeviceProp を使用すると、変数 maxThreadsPerBlock でブロックごとのスレッド数を読み取ることができます。しかし、どうすればブロックの最大数を知ることができますか? ありがとう!!