2

私はコンピュータービジョンアプリケーションに取り組んでおり、概念的な障害に悩まされています。ビデオ内の一連のロゴを認識する必要があります。これまで、SIFT(およびYuとMorelによるASIFT)、SURF、FERNSなどの機能マッチング方法を使用してきました。基本的には「汎用記述子マッチャーの共通インターフェイス」のすべてです。 OpenCVドキュメントのセクション。しかし最近、私はOCR /ランダムツリー分類器で使用される方法を研究しており(私はこのデータセットで遊んでいました:http://archive.ics.uci.edu/ml/datasets/Letter+Recognition 、これがより良いかもしれないと考えていますロゴを見つける方法。問題は、任意の画像を自動的にセグメント化する信頼できる方法が見つからないことです。

私の質問:

  1. 記述子/キーポイント以外の方法をわざわざ調べる必要がありますか、それともこれが典型的なロゴ(様式化された、少数の色、鋭いエッジ)を認識するための最良の方法ですか?

  2. サンプルデータベースと適切に照合できるように、任意の画像(または私の場合はビデオフレーム)をセグメント化するにはどうすればよいですか?
  3. HaarCascadesは同様の方法(サンプルのデータベース)で機能しているように見えますが、プロセスがどのように関連しているかを理解することはできません。そこでセグメンテーションが行われていますか?

申し訳ありませんが、これらの質問は広すぎます。私は少しの助けを借りてこのようなものに頭を包み込もうとしています。ありがとう!

4

1 に答える 1

2

セグメンテーションはあなたが望むものではないようです。私はそれが物体の検出と認識ともっと関係があると思います。特定の画像セットで、特定のロゴセットの存在を検出する必要があります。これは、一般的な色、テクスチャ、形状などの表面または領域にラベルを付けることに関するセグメンテーションとは関係がないようですが、セグメンテーションベースの方法を調べることは有用かもしれません。

ファッショナブルな方法(SIFT、GLOH、SURFなど)だけでなく、問題を調べて、適用できるすべての可能な方法を検討することを強くお勧めします。単純なテンプレートマッチング、面取りなど、古くて単純な方法を検討することをお勧めします。

Haarカスケードは、顔検出に使用されたViolaとJonesによる2000年の論文の後に人気を博しました(最新のポイントアンドクリックカメラで見られるものと同様)。興味のある問題に少し似ているように聞こえます。おそらく問題のこの部分も調べる必要がありますが、学習の部分に集中しすぎないようにしてください。

于 2011-03-13T03:14:36.773 に答える