opencv - トレーニングセットの opencv_traincascade のパラメータについてアドバイスが必要です

Question

2 つのデータセットがあります。最初の 1 つは 440x200 の 340 枚の画像サイズで、すべての画像は 9x10 px から 25x15 px のサイズのオブジェクトです。そして、440x200のサイズの約570枚の画像のネガセットがあります。これらのパラメータでトレーニングを実行します: -numPos 250 -numNeg 22000 -w 10 -h 10 --numStages 24 --minHitRate 0.995 -maxFalseAlarm -maxDepth 20 -maxWeakCount 600 -mode ALL

以前にマークアップした画像からセットを作成しました。

-numPos 320 と 300 も試しました。最初は、4 ステージ (-numPos 320) で「正のサンプル数が不十分です」というエラーで終了します。-numPos 300 を使用して同じカスケードでトレーニングを再実行します。別の 1 段階が与えられ、同じエラーが発生します。3 回目に -numPos 250 を選択すると、2 ステージに落ち、1 ステージの FalseAlarmRate は 0 でした! しかし、第 2 段階では 0.028 です。

ですから、それについてアドバイスをいただければ幸いですが、私の質問は次のとおりです。これらの少数の陽性サンプルのセットでカスケードをトレーニングすることは不可能ですか? しかし、最初の段階でも非常に小さい FalseAlarmRate が得られます。それで、それは良い分類器になることができますか？

score 3 · Accepted Answer

最初の質問:-

それぞれの種類の画像が実際にいくつ必要かは正確にはわかりません。また、検出したいオブジェクト、正確にどれだけ複雑かにも大きく依存します。たとえば、40 のポジティブサンプルと 600 のネガティブサンプルがこの Web サイトの実験で使用されているとします。 classifier.html .

しかし、オブジェクトが複雑になればなるほど、より多くのポジティブなイメージとネガティブなイメージをトレーニングする必要があると思います。私の記憶が正しければ、私が約 3 ～ 4 年前に行った手の検出プロジェクトでは、約 800 プラスのポジティブイメージと、友人や私が検出率に満足する前にネガティブイメージのほぼ 2 倍が必要でした。

基本的に、トレーニングする画像が多いほど、オブジェクト検出はより正確になります。

2 番目の質問:

注意しなければならないことの 1 つは、分類器の誤警報率が少なくとも検出率と同じくらい重要であるということです。通常、1 対 1 の誤報率が厳密に制御されていない場合、分類子全体は使用できません。

また、ほとんどの場合、誤警報エラー率は検出エラー率よりも大きいため、分類器を設計するときに誤警報率を最小化するのが難しい基準になることにも注意してください。

これを次の方法で理解してみてください:- http://www.uic.edu/classes/idsc/ids572cna/Model%20evaluation.pdf と、理解しやすく、より多くのテキストで分類器をトレーニングする方法を学ぶ別の方法: http://note.sonots .com/SciSoftware/haartraining.html

したがって、「最初の段階でも非常に小さい FalseAlarmRate が得られます。それで、優れた分類器になる可能性はありますか?」と尋ねると、私の答えは、なぜでしょうか?

また、可能であれば、ネガティブイメージをポジティブイメージの 2 倍に増やしてみてください。それは私がいつもしていることです。

私の答えがあなたを助けてくれることを願っています。幸運を。何かありましたら、お気軽にコメントください。

opencv - トレーニング セットの opencv_traincascade のパラメータについてアドバイスが必要です

1 に答える 1

Related

Reference

opencv - トレーニングセットの opencv_traincascade のパラメータについてアドバイスが必要です