3

画像内の動物を検出するために、カスケード分類子をトレーニングしています。残念ながら、私の偽陽性率は非常に高いです (Haar と LBP を使用すると非常に高く、HOG を使用すると許容範囲内です)。分類子をどのように改善できるか疑問に思っています。

ここに私の質問があります:

  • 堅牢な検出に必要なトレーニング サンプルの量は? 4000 pos と 800 neg のサンプルが必要だとどこかで読んだことがあります。それは良い見積もりですか?
  • トレーニング サンプルはどの程度異なるべきか? 可能な「重複」データを含める/除外するために、画像の違いを定量化する方法はありますか?
  • 遮られたオブジェクトをどのように処理すればよいですか? 動物の目に見える部分だけを訓練するべきですか、それとも平均 ROI がかなり一定になるように ROI を選ぶべきですか?
  • re occluded objects: 動物には足、腕、尻尾、頭などがあります。一部の体の部分は頻繁に隠れる傾向があるため、ROI として「胴体」を選択するのは理にかなっていますか?
  • 画像を縮小して小さい画像サイズでトレーニングする必要がありますか? これはおそらく物事を改善できますか?

私はここでどんな指針にもオープンです!

4

1 に答える 1

7
  • 4000 pos - 800 neg は悪い比率です。Adaboost ML アルゴリズム(すべての haar のような特徴選択プロセスのコア アルゴリズム) はネガティブ サンプルに大きく依存しているため、ネガティブ サンプルの場合は、できるだけ多くのサンプルをシステムにトレーニングする必要があります。4000 / 10000 を使用すると、適切な拡張になります。
  • 「動物」の検出は難しい問題です。あなたの問題はすでにNP困難な決定プロセスであるため、分類の範囲で複雑さが増しています。まずは猫から。猫を検出するシステムを持っています。次に、同じものを犬に適用します。たとえば 40 個のシステムを用意して、さまざまな動物を検出し、後でそれらを目的に使用します。
  • トレーニングでは、遮られたオブジェクトをポジティブとして使用しないでください。つまり、正面の顔を検出する場合は、正面の顔の前に他のオブジェクトを含めずに、位置と向きの変更のみを適用して正面の顔をトレーニングします。
  • Haar 分類器自体がすべてを 24x24 に縮小するため、縮小は重要ではありません。十分な時間があるときに、ヴィオラ・ジョーンズのプレゼンテーション全体をご覧ください。
  • 幸運を。
于 2013-07-03T11:27:25.637 に答える