NSight を使用して CUDA コードをデバッグしていますが、質問があります。特定のスレッドとブロックにブレークポイントを配置するにはどうすればよいですか?
カーネルにブレークポイントを配置すると、デバッガーは常にブロック 0 のスレッド 0 で停止します。
Nsight のオンライン ヘルプで説明されているように、ブレークポイントを設定して、次のようにブロックとスレッド ID を条件とすることができます。
CUDA C ブレークポイントにブロックまたはスレッド条件を設定するには:
タイプ:
@blockIdx(0,2,0) && @threadIdx(5,0,0)
[OK] をクリックします。ブレークポイント グリフにはプラス記号が表示されます。
CUDA Debug Focus を使用してみてください。任意のブロック内の任意のスレッドをデバッグできます...