Viola Jones 顔検出器の強力な分類器をトレーニングしたら、テスト画像に対して 24x24 サブウィンドウを実行する必要があります。画面上に移動したら、拡大縮小する必要があります (紙では毎回 x1.5 を推奨しています)。
私の質問は、これのポイントは、フィーチャがさまざまなスケールで簡単に計算されるということです。ただし、機能をどのようにスケーリングすることになっていますか? 幅/高さに倍率を掛けるだけですか?それとも、それも移動する必要がありますか?(右下に向かって拡大縮小)。または、元のサブウィンドウの高さ/幅に対する幅/高さの比率が同じになるように、それを乗算する必要がありますか?
ここに私が意味するもののイメージがあります:
元のサブウィンドウは 4x3 で、これを 2 倍して 8x6 にしています。2x1 フィーチャのサイズはどれくらいですか? そして、その左上隅はどこにあるべきですか? 同じ場所?
ありがとう