1

C で書かれた小さなプログラムを openCL に変換しようとしています。いくつかの入力データを GPU に転送してから、連続するカーネル呼び出しを使用してデバイス上ですべての計算を実行することになっています。

ただし、使用されるデータ量が多いため、CPU と GPU の間でデータをやり取りすることを避ける必要があるため、並列化に適していないコードの部分で問題に直面しています。

並列処理を行わずに一部のカーネルを実行して、コードのこれらの部分を置き換える方法はありますか? これは、グローバル作業サイズを 1 に設定することで達成されますか?

4

2 に答える 2