カーネルあたりのレジスタ数は CUDA の最適化に重要とされており、この数の上限は nvcc の「-maxrregcount=N」で設定できます。レジスタの数は、カーネル内のローカル変数 (および場合によっては渡されたパラメーター) を数えることで簡単に判断できると考えていたため、これを理解できませんでした。「nvcc --ptxas-options=-v」からのレポートは、私が考えていた方法で数えたものをはるかに超えているため、間違っていることはわかっています。誰かがそれについて少し熟考できますか?