フレームを YUV420p 形式 (またはそのような形式) から ABGR 形式にオンザフライで変換し、結果のフレームをビデオ メモリにテクスチャとして配置したいと考えています。
私が今考えることができる2つの方法があります:
- 各チャンネルをソース テクスチャにして、別のテクスチャにレンダリングします。
- 計算シェーダーで「通常どおり」実行します。
GPUのルールがよくわかりません。私のカードのように、720 個のシェーダー コア、36 個のテクスチャ ユニット、および 16 個の出力ユニットがあります。各サイクル内で、最大 40 のテクスチャをサンプリングして 16 ピクセルを出力できる一方で、720 のシェーダー操作を実行できるということですか? したがって、方法 1 を使用すると、ピクセルごとに 2 つまたは 3 つの操作しか使用しない場合でも、16 ピクセルの出力に制限されますか? 方法 2 を使用すると、1 ピクセルを 45 サイクル以内に変換できれば、方法 1 よりも高速になるということですか?