0

私は将来の変更のために独自のHoGを作成し、さまざまなアプローチを試しています。しかし、私はこの質問/問題に出くわしました。

INRIAからデータセットをダウンロードしましたが、320x240の画像があります。HoGのデフォルトのトレーニングウィンドウサイズは64x128ですが、これをどのように回避すればよいですか?

ポジティブ画像の場合、それらは約96 x 160ピクセルであり、私が行ったのは64 x 128にサイズ変更することです。しかし、より大きな画像の場合、サイズを変更するか、ピクセルごとに移動するスライディングウィンドウを使用するか、またはその大きな画像の64x128パッチの特徴を計算しますか?

4

1 に答える 1

4

これに対する答えは、アプリケーション領域とこれらの画像について何を知っているかによって完全に異なります。INRIAで遊んだことはありませんが....

1) 検索しようとしているオブジェクトは、ほぼ同じサイズで、すべての画像で同じ場所にありますか? その場合、64x128 の固定サイズ、固定位置セットはおそらく問題ありません。

2) 見つけようとしているオブジェクトは、さまざまな画像の異なる位置にあるだけで、ほぼ同じサイズですか? 次に、スライド ウィンドウが機能する可能性があります。

3) オブジェクトのサイズが変化し、画像全体のさまざまな割合を占めると思いますか? 次に、画像ピラミッドまたはその他のスケール不変の手法を使用して、スケールと場所の変動を軽減する何かを行う必要があります (画像をいくつかの中間サイズにサイズ変更し、スライディング ウィンドウ バージョンを実行することで、これを簡単に行うことができます)。各)。

また、これは分類子をトレーニングするためのものですか?その場合、適切なスケールと場所にラベルを付ける方法、および/または複数インスタンスの学習問題を解決する方法が必要です。走りたいだけなら、宣言をして自分で採点する方法が必要です...

楽しいこと盛りだくさん!

于 2012-10-23T01:37:44.220 に答える