まず、楽譜から音楽記号を検出しようとしています。たとえば、この場合、このシートhttp://www.anzacday.org.au/で gclef http://upload.wikimedia.org/wikipedia/commons/f/ff/GClef.svgを探しているとします。その他/lastpost.gif .
ポジティブなサンプルとして、1 つの音部記号の画像を使用し、本から本への変更であるすべての可能な形状をカバーするために必要な角度で回転させました。2000 サンプル、haartrainer で 1500 を使用。
ネガティブ サンプルについては、3019 個のランダムな画像をダウンロードして使用しています。もちろん、gclef シンボルがないことを確認した後です。ネガティブなイメージは、雲、オフィス、家、建物、木、ノートパソコンです。実際、stackoverflow でリンクを見つけました。3018 の負のサンプルを使用して、検索させないでください。
ネガティブサンプルは重要ですか?たとえば、私のネガティブ サンプルが雲と家である場合、たとえば音部記号のない楽譜の場合よりも鮮明な結果が得られるでしょうか? つまり、負のサンプルはオブジェクトの検出に影響しますか? 10 ~ 14 ステージの 2 つのカスケード ファイルを既に作成しましたが、非常に異なる結果が得られました。しかし、楽譜を切り取って 3000 のネガティブ サンプルを作成するのは大変です...
私のオブジェクト検出器は実際に動作することを意図しておらず、スキャンされた楽譜でのみ動作するため、検出されるのは音楽記号だけです.Haartrainingがそうでない場合は、指摘してください! n00b を完了し、自分の道を考え出すだけです。