2

いくつかの画像で分類器をトレーニングしたいと思いますが、その一部は異なる次元を持っています。

それらはすべて次の次元に分類されます。

  • 100x50
  • 50x100
  • 64x72
  • 72x64

ただし、方向ビンが 9 つあり、セルあたり 8 ピクセルの場合、それぞれが 648 個の HoG 特徴を生成します。

実際には、すべての画像がこれらのサイズのいずれかになるように選択したため、トレーニングが均一になるように、最終的に同じ数の HoG 機能を持つことになります。

私がこれを選択した理由は、トレーニング画像の対象オブジェクトの縦横比が異なる場合があるためです。そのため、一部の画像ではすべての画像を同じサイズにトリミングすると、背景が多すぎます。

ここで私の質問は、HoG 機能の数が一定である限り、トレーニング画像のアスペクト比/画像サイズが何であるかは重要ですか? (私のトレーニング アルゴリズムは、HoG 機能のみを取り込みます)。

4

1 に答える 1

4

HOG フィーチャがすべて 8x8 セルを使用している場合、異なるサイズの画像に対して同じサイズのベクトルを取得するにはどうすればよいでしょうか? より大きな画像では、より多くのセルが表示されませんか?

通常、HOG を使用する場合は、すべての画像のサイズを同じサイズに変更する必要があります。

もう 1 つの質問: 既にトリミングされた画像を分類したいだけですか、それとも大きなシーンでオブジェクトを検出したいですか? 分類したいだけなら、縦横比の変化が問題になるかもしれません。一方、スライディング ウィンドウ オブジェクトの検出を行う場合は、アスペクト比の変動がより大きな問題になります。アスペクト比に基づいてカテゴリをサブクラスに分割し、それぞれに対して個別の検出器をトレーニングする必要がある場合があります。

編集: 申し訳ありませんが、丸め誤差とアスペクト比の違いを使用して HOG ベクトルを同じ長さにするのは不正行為です。:) ポイントは、HOG セルに空間情報をエンコードさせることです。対応するセルは、異なる画像で同じスポットをエンコードする必要があります。それ以外の場合は、リンゴとオレンジを比較しています。

物体検出に関しては、アスペクト比が最も重要です。画像上でウィンドウをスライドさせますが、そのウィンドウは、検出しようとしているオブジェクトと同じ縦横比を持っている方がよいでしょう。そうしないと、うまくいきません。したがって、これら 4 つの異なるアスペクト比がある場合、最善の策は 4 つの異なる検出器をトレーニングすることです。

于 2014-07-11T17:50:24.487 に答える