6

そのため、HoG とその亜種の独自のコードを作成して、深度画像を操作しています。ただし、検出ウィンドウ部分でトレーニング済みの SVM をテストすることに行き詰まっています。

私が今行ったことは、最初に元の画像から画像ピラミッドを作成し、左上隅から右下に 64x128 サイズのスライド ウィンドウを実行することだけです。

これがそのビデオ キャプチャです: http://youtu.be/3cNFOd7Aigc

問題は、予想よりも多くの誤検知が発生していることです。

これらの誤検知をすべて削除する方法はありますか (より多くの画像でトレーニングする以外に) ? これまでのところ、マージン自体までの距離である「スコア」を SVM から取得できます。それをどのように使用して結果を活用できますか?

優れたスライディング ウィンドウ アルゴリズムを実装するための洞察を持っている人はいますか?

4

1 に答える 1