3

AMDGPU pro dirver で実行できるコードを生成するために、llvm (roc-1.6.x) を少し変更しました。実行できますが、同じ opencl コードの場合、AMDGPU のオンライン コンパイラよりもパフォーマンスが 10% 以上遅くなります。llvm を調整するために設定できるフラグがいくつかあるのではないかと思います。いくつかの例を挙げていただければ、それは素晴らしいことです。

4

0 に答える 0