特定の対象物のみに焦点を当てた画像が与えられた場合に、その対象物を高い精度で分類する分類器を作成しました。
ただし、この同じ分類器を、選択的検索またはスライディング ウィンドウを使用してより大きな画像をスキャンするオブジェクト検出器に適用すると、検出器のパフォーマンスは非常に低くなります。
理由がわかりません。これはコンピュータービジョンでは正常ですか? そして、解決策は何ですか?
特定の対象物のみに焦点を当てた画像が与えられた場合に、その対象物を高い精度で分類する分類器を作成しました。
ただし、この同じ分類器を、選択的検索またはスライディング ウィンドウを使用してより大きな画像をスキャンするオブジェクト検出器に適用すると、検出器のパフォーマンスは非常に低くなります。
理由がわかりません。これはコンピュータービジョンでは正常ですか? そして、解決策は何ですか?
もっと具体的にする必要があります。「ひどく低い」とはどういう意味ですか? 誤検知が多く見られますか? 偽陰性が多い?また、どのようなオブジェクトを検出しようとしていますか?
留意すべきことの 1 つは、スライディング ウィンドウ オブジェクト検出を行う場合、通常、対象オブジェクトの実際の位置の周囲で複数の検出が得られることです。この問題に対処する通常の方法は、重複する検出をマージすることです。たとえば、MATLAB 用の Computer Vision System Toolbox には、このための関数selectStrongestBboxが用意されています。
もう 1 つの考えられる問題は、関心のあるオブジェクトの縦横比の変化です。通常、カスケード分類器をトレーニングすると、すべての正の画像が同じ「トレーニング サイズ」 (32x32 ピクセルなど) になるようにサイズ変更されます。次に、ウィンドウをスライドさせると、ウィンドウの縦横比はトレーニング サイズと同じになります。これにより、対象オブジェクトの縦横比がほぼ同じである場合にのみ、検出精度が向上します。たとえば、これは顔に適しています。これは、通常の車とストレッチ リムジンの両方を含むカテゴリなど、さまざまなアスペクト比を持つオブジェクトのクラスにはうまく機能しません。
そしてもちろん、haar カスケード検出器は面内または面外の回転をあまり許容しないことを忘れないでください。