opengl - Compute Shader と Cuda 間のマッピング

Question

Computer Shaders と Cuda の違いと、それらがどのように動作するかを理解しようとしています。私はCudaのみを使用しており、私が理解しているように：

シェーダーベースのコンピューティングでは、シェーダーの数はピクセルの数と同じですが、Cuda では、複数の「ピクセルデータ要素」に対して動作するカーネルスレッドを使用できます。

Cuda には、データをフェッチできるさまざまなメモリタイプ (グローバル、共有、定数、テクスチャ) がありますが、シェーダーベースのコンピューティングでは何が起こるのでしょうか? さまざまなメモリの種類と、コンピューティングがグラフィックス (カーネル、入力、出力) にどのようにマップされていますか? Compute Shaders ではプロセス間の通信がないというのは本当ですか (Cuda の共有メモリと同期など)? また、コンピューティングシェーダーカーネルに関するその他の制限はありますか?

score 1 · Accepted Answer

これらは同じ一般的な目的を果たしますが、実際の違いは、計算シェーダーが OpenGL や Direct3D などのグラフィックス API の拡張であることです。コンピューティングシェーダーを使用すると、通常のプログラム可能なグラフィックスパイプライン (頂点 -> テッセレーション -> ジオメトリ -> フラグメントなど) をバイパスし、前述のパイプラインのどこかにアルゴリズムを押し込むことなく、ホスト GPU の基礎となる計算能力にアクセスできます。コンピューティングシェーダーのワークグループ内の呼び出し間に共有メモリ/同期が絶対に存在します。

また、この「ピクセル」という概念がどこから来ているのかもわかりません。コンピューティングシェーダーを作成する目的は、実際のグラフィックスパイプライン (頂点、フラグメント/ピクセルなど) にのみ適用される構成要素から開発の負担を取り除き、すべてを汎用目的 (したがってGPGPUという用語) のコンピューティング/メモリ機能に落とし込むことでした。確かに、OpenCL や CUDA などの専用 API ではなく D3D/OpenGL コンピューティングシェーダーを使用する場合、レンダリングに関連する何かを達成する必要があることがよくありますが、これは決して要件ではありません。

これらすべてをより正式なコンテキストに入れるために、GLSL 仕様が計算プロセッサをどのように導入するかを考えてみましょう。ここから取り除かなければならない重要な点は、それらが新しいタイプのシェーダーであるということですが、グラフィックスパイプラインの新しい段階ではなく、独自に存在するということです。

GLSL 4.4 仕様- 2.6 計算プロセッサ - pp. 8

計算プロセッサ

計算プロセッサは、他のシェーダプロセッサから独立して動作するプログラム可能なユニットです。

[...]

計算シェーダーは、テクスチャ、バッファー、画像変数、アトミックカウンターなど、フラグメントやその他のシェーダープロセッサと同じリソースの多くにアクセスできます。定義済みの入力も固定機能の出力もありません。これはグラフィックスパイプラインの一部ではなく、目に見える副作用は、画像、ストレージバッファー、およびアトミックカウンターへの変更によるものです。

計算シェーダーは、ワークグループと呼ばれるワークアイテムのグループで動作します。ワークグループは、同じコードを並列で実行するシェーダー呼び出しのコレクションです。ワークグループ内の呼び出しは、共有変数を介して同じワークグループの他のメンバーとデータを共有し、同じワークグループの他のメンバーと同期するためにメモリと制御バリアを発行する場合があります。

opengl - Compute Shader と Cuda 間のマッピング

1 に答える 1

GLSL 4.4 仕様- 2.6 計算プロセッサ - pp. 8

Related

Reference