インターンシップ中に GPU でオブジェクト ローカリゼーション アルゴリズムを並列化しようとしています。しかし、OpenCL の最大浮動小数点精度はかなり問題になりました。
リファレンス アルゴリズムは、特に SVM 分類子と記述子に対して常に倍精度を使用して実装されます。私は単精度で実装されているため、エラーが発生します。正規化されたエラーをチェックしたところ、プログラムのいくつかのポイントで期待どおりの結果が得られました (10^-6)。
ただし、これらのエラーは、プロセスの分類ステップの後により重要になります。
単精度のみをサポートする GPU で倍精度値をシミュレートする方法はありますか?
PS : GPU (Nvidia GTS450) で倍精度を使用できますが、プログラムはいくつかのプラットフォームでテストされます。