58

画像のロゴ認識に関して行われた最近の学術研究を知っている人はいますか?この特定の主題に精通している場合にのみ回答してください(Googleで「ロゴ認識」を自分で検索できます。ありがとうございます)。コンピュータビジョンに精通していて、オブジェクト認識の仕事をしたことがある人なら誰でもコメントを歓迎します。

更新:技術的な側面(使用されているプログラミング言語またはOpenCVを使用したかどうか...)画像のインデックス作成とコンテンツベースの画像検索の作業も役立ちます。

4

4 に答える 4

39

ここで SIFT などのローカル機能を使用してみることができます: http://en.wikipedia.org/wiki/Scale-invariant_feature_transform

ロゴの形状は通常一定であるため、抽出された特徴はうまく一致するはずです。

ワークフローは次のようになります。

  1. コーナーの検出 (Harris コーナー検出器など) - Nike ロゴの場合、それらは 2 つの鋭い端です。

  2. 記述子の計算 (SIFT - 128D 整数ベクトルなど)

  3. トレーニング段階ではそれらを覚えておいてください。マッチング段階で、トレーニング中に取得されたデータベース内のすべての機能の最近傍を見つけます。最後に、一連の一致があります (一部はおそらく間違っています)。

  4. RANSAC を使用して間違った一致をシードします。したがって、理想的なロゴ画像からロゴを見つける場所への変換を説明するマトリックスが得られます。設定に応じて、さまざまな種類の変換を許可できます (平行移動のみ、平行移動と回転、アフィン変換)。

Szeliski の本には、ローカル機能に関する章 (4.1) があります。 http://research.microsoft.com/en-us/um/people/szeliski/Book/

PS

  1. たとえば、すべてのペプシの看板を見つけて、写真のロゴを見つけたいと思っていたので、歪んでいる可能性があります。画面上で TV チャンネルのロゴを見つける必要がある場合 (回転やスケーリングが行われないようにするため)、簡単に行うことができます (パターン マッチングなど)。

  2. 従来のSIFTは色情報を考慮していません。通常、ロゴは一定の色を持っているため (正確な色は稲妻とカメラによって異なります)、何らかの方法で色情報を考慮する必要がある場合があります。

于 2010-01-19T09:36:16.230 に答える
32

実世界の画像でのロゴの検出/認識に取り組みました。また、データセットFlickrLogos-32を作成し、データ、グラウンド トゥルース、評価スクリプトを含めて公開しました。

私たちの作業では、ロゴ認識を検索問題として扱い、マルチクラス認識を簡素化し、そのようなシステムを多数 (たとえば数千) のロゴ クラスに簡単に拡張できるようにしました。

最近、複数のローカル機能の空間構成を非常に特徴的な機能バンドルに集約するBundle min-Hashingと呼ばれるバンドル手法を開発しました。バンドル表現は、検索と認識の両方に使用できます。ロゴ検出については、次のヒートマップの例を参照してください。

ここに画像の説明を入力 ここに画像の説明を入力

内部操作の詳細、アプローチの潜在的なアプリケーション、そのパフォーマンスに関する実験、そしてもちろん論文[1] [2]の関連研究への多くの参照も見つけることができます。

于 2013-01-03T11:01:08.547 に答える
7

それに取り組みました: スポーツ ビデオ データベースでの商標の照合と検索は、論文の PDF を取得します: http://scholar.google.it/scholar?cluster=9926471658203167449&hl=en&as_sdt=2000

SIFT を商標および画像記述子として使用し、正規化されたしきい値マッチングを使用してモデルと画像の間の距離を計算しました。最新の作業では、同じ商標の異なるバージョンに存在する SIFT ポイントの関連性を評価して作成されたメタモデルを使用して、計算を大幅に削減することができました。

一般に、現在使用されている TV 規格の画質が非常に悪いため、ビデオでの作業は写真での作業よりも難しいと言えます。

マルコ

于 2010-03-23T15:08:14.823 に答える
4

私は非常に似たようなことをしなければならないプロジェクトに取り組みました。まずはこのソフトを使ってHaar Trainingのテクニックを使ってみました

OpenCV

それは機能しましたが、私たちのニーズに最適なソリューションではありませんでした. ソース画像 (ロゴを探していた場所) は固定サイズで、ロゴのみが含まれていました。このため、既知の適切な一致で cvMatchShapes を使用し、返された値を比較して適切な一致と見なすことができました。

于 2010-01-15T22:38:50.410 に答える