8

の両方について質問があります

まず、SIFT を使用してリアルタイム サービスで類似画像を識別しています。携帯電話のカメラで撮影した写真のように、わずかな回転とぼやけ効果が発生する可能性があります。

そして、Phashを見つけました。それで、デモページでphashをテストします。しかし、結果は私にため息をつきました。

これは上記のテストの結果です:

Phashのデモ

このテストでは、2 つの画像が x 軸に固定されています。したがって、回転はありません。ただし、右の画像のロゴは削除され、人物は左側に移動されました。私の目には、これは「非常に似ている」です。さらに、SIFTはこれを完全にキャッチします。

では、質問です。

  1. pHash は SIFT よりも高速ですか?
  2. pHash の精度は信頼できますか?
  3. SIFT の出力は、リアルタイム サービスで使用するには大きすぎました。したがって、ハッシュを使用して、 LSH(Locality-sensitive hashing) のように出力を小さくする必要があります。私が試す他の方法はありますか?
4

1 に答える 1

9

はい、分かりました。

pHash は、ローテーションとクリティカル ムーブメントを同じものとして認識できません。

データスペースの場合、pHash は非常に使いやすかったです。これは非常に小さいサイズです: 1 つのイメージに対して 1 つのハッシュです。ただし、SIFT は特徴点を取得するために 128 バイト必要です。そして、1枚の画像には多くの特徴点があります。

最終的に、SIFT は pHash よりもよく似た画像を識別できます。しかし、ますます多くのサイズが必要になりました。

スピードベンチでは、まだテストできません。しかし、SIFTは1つの画像で多くの機能を操作する必要があるため、pHashはSIFTよりも高速だったと思います。

上記の質問に対する別の回答がある場合は、教えてください。

于 2013-05-24T07:06:13.117 に答える