2

Viola Jones 顔検出器の強力な分類器をトレーニングしたら、テスト画像に対して 24x24 サブウィンドウを実行する必要があります。画面上に移動したら、拡大縮小する必要があります (紙では毎回 x1.5 を推奨しています)。

私の質問は、これのポイントは、フィーチャがさまざまなスケールで簡単に計算されるということです。ただし、機能をどのようにスケーリングすることになっていますか? 幅/高さに倍率を掛けるだけですか?それとも、それも移動する必要がありますか?(右下に向かって拡大縮小)。または、元のサブウィンドウの高さ/幅に対する幅/高さの比率が同じになるように、それを乗算する必要がありますか?

ここに私が意味するもののイメージがあります:ここに画像の説明を入力

元のサブウィンドウは 4x3 で、これを 2 倍して 8x6 にしています。2x1 フィーチャのサイズはどれくらいですか? そして、その左上隅はどこにあるべきですか? 同じ場所?

ありがとう

4

1 に答える 1

1

はい、ウィンドウの高さと幅にそれぞれ1.25(または増やしたい倍率)を掛けるだけです。

フィーチャーの位置については、上/左/右/下も、大きなウィンドウに対して同じ相対位置を占めるようにスケーリングする必要があります。

あなたの例では、2x1の機能は4x2になり、大きなウィンドウの中央に配置されます(ところで、幅8ではなく大きなウィンドウの幅9を描画しました)。

于 2012-12-10T04:13:18.283 に答える