私は CUDA_C_Programming_Guide を読んでいます。共有メモリのトピックでは、例に出くわしました: Device Compute capability: 1.0, 共有メモリ内の 16 バンク
extern __shared__ float shared[];
float data = shared[BaseIndex + s * tid];
s
そして、彼らが「s」は奇数でなければならないと結論付けた説明では、誰かが偶数のときに何が起こり、奇数のときに何が起こるかを理解するのを手伝ってもらえますs
か?