私はコンピュータービジョンアプリケーションに取り組んでおり、概念的な障害に悩まされています。ビデオ内の一連のロゴを認識する必要があります。これまで、SIFT(およびYuとMorelによるASIFT)、SURF、FERNSなどの機能マッチング方法を使用してきました。基本的には「汎用記述子マッチャーの共通インターフェイス」のすべてです。 OpenCVドキュメントのセクション。しかし最近、私はOCR /ランダムツリー分類器で使用される方法を研究しており(私はこのデータセットで遊んでいました:http://archive.ics.uci.edu/ml/datasets/Letter+Recognition )、これがより良いかもしれないと考えていますロゴを見つける方法。問題は、任意の画像を自動的にセグメント化する信頼できる方法が見つからないことです。
私の質問:
- 記述子/キーポイント以外の方法をわざわざ調べる必要がありますか、それともこれが典型的なロゴ(様式化された、少数の色、鋭いエッジ)を認識するための最良の方法ですか?
サンプルデータベースと適切に照合できるように、任意の画像(または私の場合はビデオフレーム)をセグメント化するにはどうすればよいですか?- HaarCascadesは同様の方法(サンプルのデータベース)で機能しているように見えますが、プロセスがどのように関連しているかを理解することはできません。そこでセグメンテーションが行われていますか?
申し訳ありませんが、これらの質問は広すぎます。私は少しの助けを借りてこのようなものに頭を包み込もうとしています。ありがとう!