algorithm - 類似画像を見つけるアルゴリズム

Question

2 つの画像が「類似」しているかどうかを判断し、色、明るさ、形状などの類似パターンを認識できるアルゴリズムが必要です。人間の脳が画像を「分類」するために使用するパラメーターについて、いくつかの指針が必要になる場合があります。..

私はハウスドルフベースのマッチングを見てきましたが、それは主に変換されたオブジェクトと形状のパターンをマッチングするためのようです。

score 62 · Accepted Answer

ウェーブレット変換を使用して画像を署名に分解することにより、同様のことを行いました。

私のアプローチは、変換された各チャネルから最も重要なn 個の係数を選び、それらの位置を記録することでした。これは、abs(power) に従って (power,location) タプルのリストをソートすることによって行われました。類似した画像は、同じ場所に重要な係数があるという点で類似性を共有します。

画像を YUV 形式に変換するのが最適であることがわかりました。これにより、形状 (Y チャネル) と色 (UV チャネル) の類似性を効果的に重み付けできます。

上記の私の実装はmactoriiで見つけることができますが、残念ながら私は必要なほど多くの作業を行っていません:-)

私の友人の何人かが驚くほど良い結果を出した別の方法は、単純に画像のサイズを 4x4 ピクセルに変更し、それを署名として保存することです。2 つの画像がどの程度類似しているかは、対応するピクセルを使用して 2 つの画像間のマンハッタン距離を計算することでスコア付けできます。彼らがサイズ変更をどのように実行したかについての詳細はわかりません。そのため、そのタスクに使用できるさまざまなアルゴリズムを試して、適切なものを見つける必要があるかもしれません。

score 46 · Accepted Answer

pHashに興味があるかもしれません。

知覚ハッシュ n. オーディオ、ビデオ、またはイメージファイルのフィンガープリントで、含まれるオーディオまたはビジュアルコンテンツに基づいて数学的に作成されます。入力の小さな変化が出力の劇的な変化につながるなだれ効果に依存する暗号化ハッシュ関数とは異なり、入力が視覚的または聴覚的に類似している場合、知覚ハッシュは互いに「近い」ものです。

score 13 · Accepted Answer

私はSIFTを使用して、異なる画像内の同じオブジェクトを再検出しました。それは本当に強力ですが、かなり複雑で、やり過ぎかもしれません。画像が非常に似ていると思われる場合は、2つの画像の違いに基づくいくつかの単純なパラメータでかなりわかります。いくつかのポインタ：

画像を正規化します。つまり、両方の平均輝度を計算し、比率に応じて最も明るい値を縮小して（最高レベルでのクリッピングを回避するため）、両方の画像の平均輝度を同じにします。特に、形状に関心がある場合は、色。
チャネルごとの正規化された画像の色差の合計。
画像内のエッジを見つけて、両方の画像のエッジピクセル間の距離を測定します。（形状用）
画像を一連の個別の領域に分割し、各領域の平均色を比較します。
1つ（または一連）のレベルで画像のしきい値を設定し、結果の白黒画像が異なるピクセル数をカウントします。

score 5 · Accepted Answer

Perceptual Image Diffを使用できます

これは、知覚メトリックを使用して 2 つの画像を比較するコマンドラインユーティリティです。つまり、人間の視覚系の計算モデルを使用して、2 つの画像が視覚的に異なるかどうかを判断するため、ピクセルの小さな変化は無視されます。さらに、乱数生成の違い、OS またはマシンアーキテクチャの違いによって引き起こされる誤検出の数が大幅に減少します。

score 4 · Accepted Answer

難しい問題です！それはあなたがどれだけ正確である必要があるかに依存し、そしてそれはあなたがどんな種類の画像を扱っているかに依存します。ヒストグラムを使用して色を比較できますが、画像内のそれらの色の空間分布（つまり形状）は明らかに考慮されていません。エッジ検出とそれに続くある種のセグメンテーション（つまり、形状の選択）は、別の画像と照合するためのパターンを提供できます。共起行列を使用して、画像をピクセル値の行列と見なし、それらの行列を比較することで、テクスチャを比較できます。画像マッチングとマシンビジョンに関する優れた本がいくつかあります。Amazonで検索すると、いくつかの本が見つかります。

お役に立てれば！

score 3 · Accepted Answer

一部の画像認識ソフトウェアソリューションは、実際には純粋なアルゴリズムベースではなく、代わりにニューラルネットワークの概念を利用しています。http://en.wikipedia.org/wiki/Artificial_neural_networkと、興味深いサンプルを含む NeuronDotNet をチェックしてください: http://neurondotnet.freehostia.com/index.html

score 3 · Accepted Answer

大幅に縮小されたバージョン (例: 6x6 ピクセル) のピクセルカラー値の差の二乗和を計算するとうまくいきます。同一の画像は 0 になり、類似の画像は小さな数字になり、異なる画像は大きな数字になります。

上記の他の人のアイデアは、最初に YUV に侵入するという興味深いものに聞こえます。私のアイデアはうまく機能しますが、色盲の観察者の観点からでも、正しい結果が得られるように、画像を「異なる」ものとして計算したいと考えています。

score 3 · Accepted Answer

Kohonenニューラルネットワーク/自己組織化マップを用いた関連研究あり

アカデミックなシステム (PicSOM の Google) とアカデミックでない
( http://www.generation5.org/content/2004/aiSomPic.asp、(すべての作業環境には適していない可能性があります)) プレゼンテーションが存在します。

score 2 · Accepted Answer

必要な正確な結果に応じて、画像をnxnピクセルブロックに分割して分析することができます。最初のブロックで異なる結果が得られた場合、処理を停止することはできず、パフォーマンスが向上します。

正方形を分析するために、たとえば、色の値の合計を取得できます。

score 2 · Accepted Answer

この記事は、それがどのように機能するかを説明するのに非常に役立ちました。

http://www.hackerfactor.com/blog/index.php?/archives/432-Looks-Like-It.html

score 2 · Accepted Answer

これは視覚の問題のように聞こえます。Adaptive Boosting と Burns Line Extraction アルゴリズムを調べることをお勧めします。これら 2 つの概念は、この問題への取り組みに役立つはずです。エッジ検出は、基本を説明しているため、ビジョンアルゴリズムに慣れていない場合でも簡単に開始できます。

分類のためのパラメータに関する限り:

Color Palette & Location (グラデーション計算、色のヒストグラム)
Contained Shapes (Ada.ブースティング/形状検出トレーニング)

score 1 · Accepted Answer

2 つの画像間である種のブロックマッチングモーション推定を実行し、残差とモーションベクトルコストの全体的な合計を測定できます (ビデオエンコーダーで行うのと同じように)。これにより、動きが補正されます。ボーナスポイントとして、アフィン変換モーション推定を行います (ズームやストレッチなどを補正します)。オーバーラップブロックまたはオプティカルフローを実行することもできます。

score 1 · Accepted Answer

最初のパスとして、カラーヒストグラムを使用してみることができます。ただし、問題のドメインを絞り込む必要があります。一般的な画像マッチングは非常に難しい問題です。

score 0 · Accepted Answer

これに関する他のスレッドにはいくつかの良い答えがありますが、スペクトル分析を含む何かがうまくいくかどうか疑問に思いますか？つまり、画像を位相と振幅の情報に分解し、それらを比較します。これにより、トリミング、変換、強度の違いに関する問題の一部を回避できます。とにかく、これは興味深い問題のように思われるので、それは私が推測しているだけです。http://scholar.google.comを検索した場合、これに関するいくつかの論文を思い付くことができると確信しています。

algorithm - 類似画像を見つけるアルゴリズム

16 に答える 16

Related

Reference