私は一般的にCPUが多くの計算ユニットまたはCUDAコアを持っていることを知っています。これにより、計算集約型のアルゴリズムに適しています。
しかし、なぜCPUよりもはるかに多くのコアを備えているのでしょうか。画像をレンダリングする場合、どの種類のアルゴリズムが並列化可能ですか?
この膨大な数の計算ユニットは、シェーダーを適用するときにフレームを高速に処理するために必要です。
このタイプのコンピューティングは、各シェーダーが n 回 (場合によってはピクセルごとに 1 回) 適用され、多くの場合、同じフレームで独立した方法で適用されるため、高度に並列化できます。
各コンピューティング ユニットは多くのシェーダー コアで構成されていることに注意してください。
これが、シェーダーのサポートが OpenCL の前提条件である理由です。これは、レンダリング ジョブを実行する専用のコア、他のことを実行するために「ハイジャック」できるコアを意味するためです => これはGPGPUと呼ばれます。