現在、いくつかの cuda カーネルを最適化しようとしています...
オプション --ptxas-options=-v でコンパイルすると、レジスタ %co に関する情報が得られます。
私の場合、私は常にいくつかの余分な行を取得しますが、これは私には意味がありません:
ptxas : info : Compiling entry function '_Z20backprojLinTexInterpP7double3S0_S0_P7double2iiiiiS2_PdPf' for 'sm_20'
ptxas : info : Function properties for _Z20backprojLinTexInterpP7double3S0_S0_P7double2iiiiiS2_PdPf
8 bytes stack frame, 0 bytes spill stores, 0 bytes spill loads
ptxas : info : Used 47 registers, 32 bytes smem, 112 bytes cmem[0], 56 bytes cmem[16]
ptxas : info : Function properties for __internal_trig_reduction_slowpathd
40 bytes stack frame, 0 bytes spill stores, 0 bytes spill loads
1 行目から 4 行目までは明らかですが、最後の行は何ですか?
Googleはここでは役に立ちません....私はすでに試しました。
これらの行の意味を誰か知っていますか? プログラムでコンパイルされたカーネルごとにそれらを取得します