opencl - OpenCL 浮動小数点の精度管理

翻译自：https://stackoverflow.com/questions/17588042 2013-07-11T08:00:03.227

271 次

インターンシップ中に GPU でオブジェクトローカリゼーションアルゴリズムを並列化しようとしています。しかし、OpenCL の最大浮動小数点精度はかなり問題になりました。

リファレンスアルゴリズムは、特に SVM 分類子と記述子に対して常に倍精度を使用して実装されます。私は単精度で実装されているため、エラーが発生します。正規化されたエラーをチェックしたところ、プログラムのいくつかのポイントで期待どおりの結果が得られました (10^-6)。

ただし、これらのエラーは、プロセスの分類ステップの後により重要になります。

単精度のみをサポートする GPU で倍精度値をシミュレートする方法はありますか?

PS : GPU (Nvidia GTS450) で倍精度を使用できますが、プログラムはいくつかのプラットフォームでテストされます。

1 に答える 1