1

データベース レコードに LSH を使用しているため、同様のレコードが同じバケットにブロックされるインデックス (データベース インデックスではなく、単純なハッシュマップ) を作成しています。データベースには、数百万のレコードが含まれる場合があります。私の質問は、以下に投稿するデザインに関するものです。

ここに画像の説明を入力

まず、LSH を実行して利用可能なデータベースを使用してインデックスを作成します。しかし、新しいレコードがデータベースに挿入されると、そのレコードもインデックスに登録する必要があります。LSHを使用してこれを行うにはどうすればよいですか? LSH はそのレコードを同様のレコードを持つバケットに割り当てることができますか?? LSH はデータセットの更新をサポートしていますか?

4

1 に答える 1

2

私はC++ で書かれたE2LSH (素晴らしい人である Andoni によって開発された) を使用します。プロジェクトのサイトでは、次のように言及されています。

最新の (完全ではない) LSH アルゴリズム (2014): これらのアルゴリズムは、データ依存ハッシュを使用することで、従来の LSH アルゴリズムよりも優れたパフォーマンスを実現します。これらは、ハミング空間とユークリッド空間の両方で従来の LSH アルゴリズムを改善します。ただし、これらのアルゴリズムは動的ではありません。従来の LSH アルゴリズムとは対照的に、データに依存しないハッシュを使用するため、ポイントセットを更新できます。

ライブラリを使用したくないが、何らかの理由で独自のライブラリを開発したい場合は、まずマニュアルを学習することをお勧めします。

于 2015-09-07T05:16:17.297 に答える