7

2つの画像間の類似性を計算するためのさまざまなアルゴリズムがありますが、類似した画像をすばやく見つけることができるように、この情報をデータベースに保存する方法については何も見つかりません。

「類似」とは、回転(90度刻み)、色調整、および/または再保存(非可逆jpeg圧縮)された正確な複製を意味します。

すばやく検索できるように、画像の「指紋」を考え出そうとしています。

私がこれまでに思いついた最善の方法は、グレースケールヒストグラムを生成することです。16個のビンと256色のグレーで、16バイトの指紋を簡単に作成できます。これはかなりうまく機能しますが、私が望むほど堅牢ではありません。

私が試したもう1つの解決策は、画像のサイズを変更し、すべて同じ方向になるように回転させ、グレースケールし、ヒストグラムを正規化してから、約8x8に縮小し、色を16段階のグレーに縮小することでした。ミニチュア画像は非常に似ていますが、通常は1〜2ピクセルずれているため、正確に一致させることはできません。

完全に一致しないと、類似した写真をグループ化する効率的な方法はないと思います(すべての写真を他のすべての写真と比較せずに、つまりO(n ^ 2))。

それで、(1)上記の要件に不変の指紋/署名を作成するにはどうすればよいですか?または、(2)それが不可能な場合、単一の画像が与えられた場合に、数千のデータベースで最適なものを見つけることができるように、他にどのようなメトリックを使用できますか?

4

1 に答える 1

4

あなたの質問には少し紛らわしいことがあります.あなたがリンクした「指紋」は、明らかに同様の画像を見つけることを意図したものではありません(引用):

通常、TinEye は類似の画像 (つまり、同じ主題の別の画像) を検出しません。トリミング、編集、またはサイズ変更されたものを含め、完全に一致するものを見つけます。

とはいえ、あなたが求めていることを理解していること、および編集された正確なコピーだけでなく、類似したすべての画像を実際に見つけたいと思っていることを前提としています。

詳しく知りたい場合は、Sivic、ZissermanおよびNister 、Stewenius による論文を調べることをお勧めします。これらの 2 つの論文 (および最近のかなりの数の論文) が使用しているアイデアは、テキスト検索技術を画像データベースに適用しようとしており、Google がドキュメント (Web ページ) を検索するのと同じ方法で画像データベースを検索することです。 ) データベース。

私がリンクした最初の論文は、この種のアプローチの良い出発点です。なぜなら、それは主に大きな問題に取り組んでいるからです:画像の中の「言葉」は何ですか? . テキスト検索技術はすべて単語に焦点を当てており、単語数などの計算に基づいて類似度を測定します。したがって、画像をビジュアル ワードのコレクションとしてうまく表現することが、テキスト検索技術を画像データベースに適用するための最初のステップとなります。

次に、2 番目の論文では、テキスト手法を使用するというアイデアを拡張し、より適切な検索構造を提示します。これにより、より高速な画像検索とより大きな画像データベースが可能になります。また、基礎となる検索構造に基づいて画像記述子を構築する方法も提案しています。

両方の論文で視覚的な言葉として使用されている機能は、不変性の制約を満たす必要があり、2 番目の論文は、必要なデータベース サイズで確実に機能するはずです (最初の論文のアプローチでも機能する可能性があります)。

最後に、同じ著者による新しい論文を探すことをお勧めします (私は Nister が何か新しいことをしたと確信しています。リンクされた論文からのアプローチが今まで私にとって十分だっただけです)。コンテンツ ベースの画像 (インデックス作成および) 検索(CBIR)に関する論文- 現在非常に人気のあるテーマなので、たくさんあるはずです。

于 2012-05-07T12:40:43.577 に答える