opencv - ネガティブサンプルの品質は、haar トレーナーの出力に影響しますか? OpenCV

Question

まず、楽譜から音楽記号を検出しようとしています。たとえば、この場合、このシートhttp://www.anzacday.org.au/で gclef http://upload.wikimedia.org/wikipedia/commons/f/ff/GClef.svgを探しているとします。その他/lastpost.gif .

ポジティブなサンプルとして、1 つの音部記号の画像を使用し、本から本への変更であるすべての可能な形状をカバーするために必要な角度で回転させました。2000 サンプル、haartrainer で 1500 を使用。

ネガティブサンプルについては、3019 個のランダムな画像をダウンロードして使用しています。もちろん、gclef シンボルがないことを確認した後です。ネガティブなイメージは、雲、オフィス、家、建物、木、ノートパソコンです。実際、stackoverflow でリンクを見つけました。3018 の負のサンプルを使用して、検索させないでください。

ネガティブサンプルは重要ですか？たとえば、私のネガティブサンプルが雲と家である場合、たとえば音部記号のない楽譜の場合よりも鮮明な結果が得られるでしょうか? つまり、負のサンプルはオブジェクトの検出に影響しますか? 10 ～ 14 ステージの 2 つのカスケードファイルを既に作成しましたが、非常に異なる結果が得られました。しかし、楽譜を切り取って 3000 のネガティブサンプルを作成するのは大変です...

私のオブジェクト検出器は実際に動作することを意図しておらず、スキャンされた楽譜でのみ動作するため、検出されるのは音楽記号だけです.Haartrainingがそうでない場合は、指摘してください! n00b を完了し、自分の道を考え出すだけです。

score 4 · Accepted Answer

家、木、車を想定していないのに、なぜそれらをネガティブサンプルに使用するのでしょうか。分析する画像に実際に発生する画像パッチを使用することをお勧めします。たとえば、ヘ音記号は、木のパッチよりもアグ記号にかなり近くなります。実際、現実世界はビットマップスタイルではないため、画像上のほとんどすべての記号は、現実世界の画像よりも ag clef に近くなります。

1回のトレーニングで、音部記号の異なる回転を使用しましたか? それをしないでください！Haar トレーニングは回転不変ではありません。シートが回転することが予想される場合は、画像を回転させ、回転した画像ごとに検出を実行することをお勧めします。

または...線を検出することでシートの向きを検出し（ハフ線など）、一度だけ回転させて画像を直立させてから検出を実行できます。

テスト用のほんの数個のサンプルから始めることができます (10 個の陽性、100 個の陰性としましょう)。トレーニングはそれほど長くはかかりません。ト音記号は非常に特徴的であるため、訓練しやすいはずです。正しい方向に進んでいることがわかった場合は、サンプルを追加して検出器の品質を改善できます。

幸運を！:)

ところで: あなたはトランペッターですか? ;)

score 3 · Accepted Answer

はい、否定は重要であり、可能な限り最良の状態で分類器をトレーニングする必要があります。つまり、予測中に与える画像、つまり楽譜の画像を使用して分類器をトレーニングする必要があります。そこで、ト音記号のない楽譜から抽出した画像をネガティブサンプルとして使用します。他の種類の画像をネガセットに追加することもできます。

score 1 · Accepted Answer

ネガ画像のセットはこちら: http://tutorial-haartraining.googlecode.com/svn/trunk/data/negatives/

opencv - ネガティブ サンプルの品質は、haar トレーナーの出力に影響しますか? OpenCV

3 に答える 3

Related

Reference

opencv - ネガティブサンプルの品質は、haar トレーナーの出力に影響しますか? OpenCV