opencv - CUDA でプログラムされた GPU は、OpenCV 適応しきい値の実装に適していますか?

Question

私のシステムでは、大きなウィンドウサイズ (75 ピクセル) の 5 MP 画像の場合、完了までになんと140 ミリ秒 (線形操作の約 20 倍) かかるため、最適化を検討しています。OpenCV gpu モジュールが gpu バージョンを実装していないことに気付いたadaptiveThresholdので、GPU にそのアルゴリズムを自分で実装することを考えていました。

GPU にメモリをロードするためのオーバーヘッドを無視して、大きなウィンドウサイズ (50px+) と大きな画像 (5 MP+) に基づいて CUDA に適応しきい値アルゴリズムを実装すると、スピードアップを期待できますか?

adaptiveThresholdopencv.org のドキュメント:

http://docs.opencv.org/modules/imgproc/doc/miscellaneous_transformations.html#adaptivethreshold

score 3 · Accepted Answer

エリックの答えに基づいて構築：

Npp CUDA ライブラリは adaptThreshold を実装していませんが、非常に簡単な方法で適応しきい値を取得するのに有益なようです (テストしたところ、逸話的に機能します)。

ボックスフィルターを実行しsrc(つまり、すべてのピクセルの平均ウィンドウ値を計算します)、中間イメージに保存しますtmp。
の各ピクセルから数値 K を減算します。tmp
srcとの間で比較関数を実行tmpしdstます。終わり。

コードは次のようになります (ここでは K=0、2 番目のステップは省略されています)。

nppiFilterBox_8u_C1R(oDeviceSrc.data(), oDeviceSrc.pitch(),
                                  oDeviceIntermediate.data(), oDeviceDst.pitch(),
                                  oSizeROI, oAdapThreshWindowSize,oAnchor);
nppiCompare_8u_C1R(oDeviceSrc.data(),oDeviceSrc.pitch(),
                   oDeviceDst.data(),oDeviceDst.pitch(),
                   oDeviceResult.data(),oDeviceResult.pitch(),
                   oSizeROI,NPP_CMP_LESS);

また、ウィキペディアは、ボックスフィルターを 3 回続けて適用すると、ガウスフィルターを 97% の精度で近似すると主張しています。

opencv - CUDA でプログラムされた GPU は、OpenCV 適応しきい値の実装に適していますか?

3 に答える 3

Related

Reference