一般的なシングル プロセッサ コアと比較して、CUDA または OpenCL コードのアルゴリズムはどれくらい高速に実行できますか? (アルゴリズムは、CPU と GPU の両方のターゲットに対して記述および最適化されていることを考慮してください)。
グラフィックカードとCPUの両方に依存することは知っていますが、NVIDIAの最速GPUの1つと(シングルコアの)Intel i7プロセッサと言ってください。
また、アルゴリズムの種類にも依存することを知っています。
厳密な回答は必要ありませんが、経験豊富な例:倍精度浮動小数点を使用する画像操作アルゴリズムの場合、ピクセルあたり 10 回の操作で最初の 5 分かかり、このハードウェアを使用すると x 秒で実行されます。