9

アプリケーションのスクリーンショットを撮り、正確な画像が以前に見られたかどうかを検出しようとしています。ささいな変更を異なるものとして検出しようとしています-たとえば、画像にテキストがあり、スペルが変更されている場合、それは不一致としてカウントされます。

スクリーンショット画像のコンテンツの MD5 ハッシュを使用して、既知の画像のデータベースを検索し、それが以前に見られたかどうかを検出することに成功しました。

今、私はそれを別のマシンに移植しました。構成を正確に一致させようとしたにもかかわらず、古いマシンとはわずかに異なるイメージを取得しています. 違うと言うと微妙な変化で、古い画像と新しい画像を引き延ばしてフリックしてみても、違いは一つも分かりません!それにもかかわらず、ImageMagick のcompareコマンドは、異なるピクセルの散らばりを見ることができます。

そのため、MD5 ハッシュが一致しなくなりました。単純な MD5 ハッシュではなく、イメージ ハッシュが必要です。

調査を行ったところ、ほとんどの画像ハッシュはかなり寛大にしようとしていることがわかりました。サイズ変更、変換、透かしが入った画像を受け入れ、対応する偽陽性の一致があります。はるかに厳密な画像ハッシュが必要です。許可される変更は、色のわずかな変更のみです。

画像ハッシュ ライブラリまたはアルゴリズムを推奨できる人はいますか? ( dupdetectorのようなアプリケーションではありません)。

覚えておいてください:私の要件は、縮小pHashのようなリベラルなアルゴリズムが必要ないという点で、多くの同様の質問とは異なります。また、構造的類似性ImageMagick の比較のような比較ツールも必要ありません。

非常によく似た画像に同じハッシュ値を与えるハッシュが必要です。それは可能ですか?

4

1 に答える 1

1

「スペクトルハッシュ」と呼ばれる次の論文を見ることができます。これは、類似した画像をグループ化するために、画像からハッシュ コードを生成するように設計されたアルゴリズムです (論文の最後にある検索例を参照してください)。これは良い出発点です。

リンク: http://www.cs.huji.ac.il/~yweiss/SpectralHashing/

于 2012-04-25T10:26:04.163 に答える