カラー ルックアップ テーブルを作成するプログラムをコーディングしました。私は CUDA と OpenCL でそれを行いました。私の観点からは、両方のプログラムはほとんど同じです。つまり、同じ量の定数メモリ、グローバル メモリ、同じループと分岐コードなどを使用します。
実行時間を測定したところ、CUDA は OpenCL よりわずかに優れていました。私の質問は、CUDA がそのような GPU をプログラミングするネイティブな方法であるため、CUDA + NvidiaGPU を使用する方が OpenCL + NvidiaGPU よりも速いかどうかです。
このトピックに関連する情報へのリンクをいくつか共有していただけますか?