大規模なコレクションで類似した画像を検索できるアルゴリズムを探しています。私は現在、OpenCLでSURF実装を使用しています。
最初は、KNN検索アルゴリズムを使用して、すべての画像の関心点をコレクションの残りの部分と比較しましたが、テストの結果、スケーリングがうまくいかないことがわかりました。また、 KNN-JoinのHadoop実装を試しました。これは、入力データの量に比べて、HDFSで実際に多くの一時的なスペースを必要とします。実際、私の入力ベクトルの次元のために、ペアワイズ距離アプローチは実際には適切ではありません(64)。
Locally Sensitive Hashingのことを聞いて、無料の実装があるのか、それとも実装する価値があるのか、私が知らない別のアルゴリズムがあるのではないかと考えました。