私はCUDAプロジェクトを持っています。これは、アプリケーション ロジックを含むいくつかの .cpp ファイルと、複数のカーネルと__host__
それらを呼び出す関数を含む 1 つの .cu ファイルで構成されています。
ここで、カーネルが使用するレジスタの数を特定したいと考えています。私の通常のコンパイラ呼び出しは次のようになります。
nvcc -arch compute_20 -link src/kernel.cu obj/..obj obj/..obj .. -o bin/..exe -l glew32 ..
.
残念ながら、この呼び出しに "-Xptxas –v" コンパイラ フラグを追加しても効果はありません。コンパイラは、以前と同じテキスト出力を引き続き生成します。コンパイルされた .exe も以前と同じように動作しますが、例外が 1 つあります。私のフレームレートは 80 fps から 1800 fps に跳ね上がります。