OpenCV Haar カスケード分類器は、正のトレーニング データとして顔の 24x24 画像を使用しているようです。これに関して 2 つの質問があります。
- より大きなトレーニング画像はより多くの処理を必要とするという事実以外に、トレーニング画像のサイズを選択する際の考慮事項は何ですか?
- 正方形でない画像の場合、一方のサイズを 24 ピクセルに保ち、必要に応じてもう一方のサイズを拡大することを選択した人もいます (たとえば、100 ~ 200 ピクセル)。これは正しい戦略ですか?
- トレーニング画像のサイズを決定するにはどうすればよいですか (これは質問 1 の変形です)