この情報はどこから来たのか気になります。これらの変数にアクセスするとき、本当にレジスタにアクセスしているのか、それとも他の場所にアクセスしているのか? (私の推測では、これらはレジスター値です。) レジスター
に格納することで速度が向上するのでしょうか?
__global__ void myKernel(int, float, int*) {
const int reg1= threadIdx.y // gonna use/Rd reg1 some 50 different places
:
:
}
または、threadIdx.y を約 50 回読み取るのと同じくらい高速でしょうか?