ユークリッド距離を使用する Python 3 での LSH の効率的な実装を探しています。
「in-python」LSHForest
実装がありますが、コサイン距離を使用します。
また、この実装を使用しても、各バスケットのコンテンツを表示する方法が見つかりませんでした。たとえば、クラスタリングに LSH を使用している場合、特定の半径内にある特定の数のおおよそのネイバーのみが返されます。しかし、すべての隣人を見たい場合、それがどのように行われるかわかりません(任意の検索半径を使用したくありません。これを使用して非常に大きなまたは無限の半径の意味が何であるかが本当にわかりません実装)。
どんな洞察にも感謝します。どうもありがとう。