OpenCV の HOGDescriptor::compute 関数を使用して、ポジティブ イメージとネガティブ イメージ (INRIA の人物データセットから) から HoG 特徴を抽出することができました。
また、データを正しくパックして、トレーニング目的で CvSVM にフィードすることもできました。
いくつか質問があります:
特徴を抽出する際、96 x 128 のサイズのポジティブ イメージを使用しましたが、ネガティブ イメージは平均 320 x 240 です。HoG 抽出に 64 x 128 のウィンドウ サイズを使用していますが、他のウィンドウ サイズを使用する必要がありますか?
ポジティブ画像の抽出された特徴のサイズは約 28800 特徴であり、ネガティブ画像は約 500000+ です。負の機能を 28800 に切り捨てましたが、これは間違っていると思います。これらの機能を SVM にフィードするときにあまりにも多くの情報を失っていると思うからです。どうすればこれに取り組めますか?(ネガティブとポジティブの特徴に対して同じサンプルサイズしかフィードできないようです)
64 x 128 (または 96 x 160) より大きい画像で予測を行う場合、スライディング ウィンドウを使用して予測を行う必要がありますか? 大きなネガ画像でも 500000 を超える機能が得られるため、サンプル サイズが原因で SVM にフィードできません。