最近はCUDA開発環境、OSはWindows server 2008、グラフィックカードはTeslaC2070、コンパイラはVS2010を使ってプログラム(FDTD操作)を作っています。このプログラムは、単精度および倍精度の浮動小数点を使用して計算します。
CUDA プログラミング ガイド 3.2 および 4.0 を読んでいました。付録では、ガイドが教えてくれますsin()
、cos()
最大精度は 2 ULP です。私のオリジナルの CPU プログラムは、CUDA バージョンとは異なる結果を生成します。
結果を正しく同じにしたい。出来ますか?