マルチ GPU 並列アルゴリズムを作成しています。私が直面している問題の 1 つは、1 つの cl_mem を複数のデバイスにプッシュし、同じカーネルを同時に実行させるとどうなるかを調べることです。カーネルは、デバイスに渡されるメモリを変更します。
OpenCL コードのコーディングとデバッグには非常に時間がかかります。だから私はそれを始める前に仲間のStackoverflowユーザーからいくつかのアドバイスを受けたい - 私は以下の両方のシナリオでそのようなことをした結果を知りたい.使用されているのは、この cl_mem が指すメモリの同じ領域であり、デバイスに適切にコピーされますか? など):
- メモリは CL_MEM_COPY_HOST_PTR で作成されます
- メモリは CL_MEM_USE_HOST_PTR で作成されます