cuda - CUDA の場合、スレッドは GPU 上の単一の SP にとどまりますか?

Question

CUDA をプログラミングするとき、スレッドブロックが SM でスケジュールされ、他の SM に移行されないことは誰もが知っています。スレッドブロックのスレッドに関しては、実行中は 1 つの SP にとどまりますか、それとも命令を別の SP に任意にスケジュールできますか?

score 4 · Accepted Answer

プログラミングモデルは、スレッドを 1 つの CUDA コアに制限しません。ブロック内のスレッドは共有メモリを介して通信でき、共有メモリには同じ SM 内のスレッドのみがアクセスできるため、スレッドブロックは単一の SM 上で実行する必要があります。この制限は、GPU をモバイルからスーパーコンピューティングに拡張することを可能にするものの一部です。

スレッドが単一の CUDA コアで実行されるかどうかを知ることが役立つのはなぜですか? CUDA モデルはスループットコンピューティング用です。つまり、1 つのスレッド (ワープ) がレイテンシーのある操作を実行しているときに、ハードウェアが別のスレッド (ワープ) を即座に取り込んでギャップを埋めることができます。その結果、特定のスレッドがどこで実行されているかは問題になりません。

score 1 · Accepted Answer

1 つの固定 SP に 1 つのスレッドを制限する必要はなく、SP の固定グループ内の任意の SP に自由にスレッドを発行することが簡単かつ効率的であると考えています (つまり、設計を容易にするために 1 つの SM を異なるブロックに分割することができます)。相互接続を最小限に抑えます）。

cuda - CUDA の場合、スレッドは GPU 上の単一の SP にとどまりますか?

3 に答える 3

Related

Reference