これは「宿題」の問題かもしれませんが、ここで助けを得ることができるように十分にやったと思います.
私の課題では、動作中の OpenGL/OpenCL アプリケーションがあります。OpenGL アプリケーションはシーンをレンダリングし、OpenCL は被写界深度のような効果を適用する必要があります。OpenCL パーツは、各ピクセルが元の色と深さを持つテクスチャを取得し、特定のピクセルの色を出力する必要があります。OpenCL の一部であるピクセル単位の関数のみを変更することになっています。
計算されたピクセルの周囲の領域をサンプリングする、可変サイズのガウス フィルターを使用した実用的なソリューションが既にあります。しかし、専用の NVidia グラフィックス カードでも、高解像度では遅延が発生します。冗長な操作のほとんどを最適化しようとしましたが、パフォーマンスはあまり向上しませんでした。
Web も検索してみましたが、見つけたすべてのアルゴリズムは OpenGL または DirectX のグラフィカル パイプラインと密接に結びついており、私のシナリオでは使用できません。
私の状況で機能するアルゴリズムはありますか?