1

考えられるすべての機能を列挙できない場合 (たとえば、ユーザーを比較するときの Facebook のいいね) に備えて、局所性に敏感なハッシュについて頭を悩ませようとしています。この問題に対処するソリューションはありますか?

私がこれまで見てきた場所に依存するハッシュ アルゴリズムは、特徴 (単語など) の総数kである長さの有限ベクトルに依存しています。k私の場合、事前にフィーチャのセット全体を把握していませんが、データベース内の新しいアイテムの n 最近傍を見つけたいと考えています。データベースの目標サイズを考えると、各挿入のペアワイズ類似度を再計算することは現実的ではありません。

どうすればこの問題に取り組むことができますか? 誰かが同様の問題に遭遇し、解決策を見つけましたか?

4

0 に答える 0