私はCUDAとOpenCLが初めてです。
プログラムのカーネルを CUDA カーネルから OpenCL カーネルに変換しました。両方のバージョンで乱数生成に同じシードを使用しています。OpenCL バージョンでは実行ごとにまったく同じ結果が得られますが、CUDA バージョンでは実行ごとにわずかに異なる結果が得られます。なしでCUDAバージョンをコンパイルしてい-use_fast_math
ます。私のデバイスは 1.1 機能です。何が原因でしょうか?
前もって感謝します
私はCUDAとOpenCLが初めてです。
プログラムのカーネルを CUDA カーネルから OpenCL カーネルに変換しました。両方のバージョンで乱数生成に同じシードを使用しています。OpenCL バージョンでは実行ごとにまったく同じ結果が得られますが、CUDA バージョンでは実行ごとにわずかに異なる結果が得られます。なしでCUDAバージョンをコンパイルしてい-use_fast_math
ます。私のデバイスは 1.1 機能です。何が原因でしょうか?
前もって感謝します