1

OpenCV の HOGDescriptor::compute 関数を使用して、ポジティブ イメージとネガティブ イメージ (INRIA の人物データセットから) から HoG 特徴を抽出することができました。

また、データを正しくパックして、トレーニング目的で CvSVM にフィードすることもできました。

いくつか質問があります:

  • 特徴を抽出する際、96 x 128 のサイズのポジティブ イメージを使用しましたが、ネガティブ イメージは平均 320 x 240 です。HoG 抽出に 64 x 128 のウィンドウ サイズを使用していますが、他のウィンドウ サイズを使用する必要がありますか?

  • ポジティブ画像の抽出された特徴のサイズは約 28800 特徴であり、ネガティブ画像は約 500000+ です。負の機能を 28800 に切り捨てましたが、これは間違っていると思います。これらの機能を SVM にフィードするときにあまりにも多くの情報を失っていると思うからです。どうすればこれに取り組めますか?(ネガティブとポジティブの特徴に対して同じサンプルサイズしかフィードできないようです)

  • 64 x 128 (または 96 x 160) より大きい画像で予測を行う場合、スライディング ウィンドウを使用して予測を行う必要がありますか? 大きなネガ画像でも 500000 を超える機能が得られるため、サンプル サイズが原因で SVM にフィードできません。

4

1 に答える 1

1

すべてのパッチを同じサイズにリサイズできないのはなぜですか? Hog ディスクリプタは、ウィンドウ サイズ、ブロック、およびセル サイズによって異なります。さまざまな組み合わせを試す必要があります。小さなセルを使用すると、細部をキャプチャできますが、一般性が失われ、その逆も同様です。1.) 質問を理解していない 2.) すべての記述子を同じサイズにし、サイズ変更された画像から豚を抽出します。3.) 質問が理解できない

于 2012-08-14T19:03:38.423 に答える