2

まず、楽譜から音楽記号を検出しようとしています。たとえば、この場合、このシートhttp://www.anzacday.org.au/で gclef http://upload.wikimedia.org/wikipedia/commons/f/ff/GClef.svgを探しているとします。その他/lastpost.gif .

ポジティブなサンプルとして、1 つの音部記号の画像を使用し、本から本への変更であるすべての可能な形状をカバーするために必要な角度で回転させました。2000 サンプル、haartrainer で 1500 を使用。

ネガティブ サンプルについては、3019 個のランダムな画像をダウンロードして使用しています。もちろん、gclef シンボルがないことを確認した後です。ネガティブなイメージは、雲、オフィス、家、建物、木、ノートパソコンです。実際、stackoverflow でリンクを見つけました。3018 の負のサンプルを使用して、検索させないでください。

ネガティブサンプルは重要ですか?たとえば、私のネガティブ サンプルが雲と家である場合、たとえば音部記号のない楽譜の場合よりも鮮明な結果が得られるでしょうか? つまり、負のサンプルはオブジェクトの検出に影響しますか? 10 ~ 14 ステージの 2 つのカスケード ファイルを既に作成しましたが、非常に異なる結果が得られました。しかし、楽譜を切り取って 3000 のネガティブ サンプルを作成するのは大変です...

私のオブジェクト検出器は実際に動作することを意図しておらず、スキャンされた楽譜でのみ動作するため、検出されるのは音楽記号だけです.Haartrainingがそうでない場合は、指摘してください! n00b を完了し、自分の道を考え出すだけです。

4

3 に答える 3

4

家、木、車を想定していないのに、なぜそれらをネガティブ サンプルに使用するのでしょうか。分析する画像に実際に発生する画像パッチを使用することをお勧めします。たとえば、ヘ音記号は、木のパッチよりもアグ記号にかなり近くなります。実際、現実世界はビットマップ スタイルではないため、画像上のほとんどすべての記号は、現実世界の画像よりも ag clef に近くなります。

1回のトレーニングで、音部記号の異なる回転を使用しましたか? それをしないでください!Haar トレーニングは回転不変ではありません。シートが回転することが予想される場合は、画像を回転させ、回転した画像ごとに検出を実行することをお勧めします。

または...線を検出することでシートの向きを検出し(ハフ線など)、一度だけ回転させて画像を直立させてから検出を実行できます。

テスト用のほんの数個のサンプルから始めることができます (10 個の陽性、100 個の陰性としましょう)。トレーニングはそれほど長くはかかりません。ト音記号は非常に特徴的であるため、訓練しやすいはずです。正しい方向に進んでいることがわかった場合は、サンプルを追加して検出器の品質を改善できます。

幸運を!:)

ところで: あなたはトランペッターですか? ;)

于 2012-11-07T09:05:21.773 に答える
3

はい、否定は重要であり、可能な限り最良の状態で分類器をトレーニングする必要があります。つまり、予測中に与える画像、つまり楽譜の画像を使用して分類器をトレーニングする必要があります。そこで、ト音記号のない楽譜から抽出した画像をネガティブ サンプルとして使用します。他の種類の画像をネガ セットに追加することもできます。

于 2012-11-07T08:53:03.950 に答える
1

ネガ画像のセットはこちら: http://tutorial-haartraining.googlecode.com/svn/trunk/data/negatives/

于 2013-04-13T11:51:20.137 に答える