1

私はCUDAとOpenCLが初めてです。

プログラムのカーネルを CUDA カーネルから OpenCL カーネルに変換しました。両方のバージョンで乱数生成に同じシードを使用しています。OpenCL バージョンでは実行ごとにまったく同じ結果が得られますが、CUDA バージョンでは実行ごとにわずかに異なる結果が得られます。なしでCUDAバージョンをコンパイルしてい-use_fast_mathます。私のデバイスは 1.1 機能です。何が原因でしょうか?

前もって感謝します

4

2 に答える 2

1

問題が見つかりました。元のコードでは、一部の値が非同期で更新され、まだ完全には更新されていませんでした。みんな助けてくれてありがとう。そしてお手数おかけして申し訳ありません。

于 2013-07-11T15:16:32.137 に答える