Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
AMDGPU pro dirver で実行できるコードを生成するために、llvm (roc-1.6.x) を少し変更しました。実行できますが、同じ opencl コードの場合、AMDGPU のオンライン コンパイラよりもパフォーマンスが 10% 以上遅くなります。llvm を調整するために設定できるフラグがいくつかあるのではないかと思います。いくつかの例を挙げていただければ、それは素晴らしいことです。