ねえ、私がコンパイルすると、次のnvcc -arch=sm_13
ようになります。
ptxas info : Used 29 registers, 28+16 bytes smem, 7200 bytes cmem[0], 8 bytes cmem[1]
私が使用すると、次のようnvcc -arch=sm_20
になります。
ptxas info : Used 34 registers, 60 bytes cmem[0], 7200 bytes cmem[2], 4 bytes cmem[16]
すべてのカーネルパラメータが共有メモリに渡されると思いましたが、sm_20の場合はそうではないようです...?!おそらく、それらはレジスターにも渡されますか?私の関数のヘッドは次のようになります。
__global__ void func(double *, double , double, int)
これまでのところありがとう!