3

コサイン類似度メトリックとその他のユーザー定義メトリックを使用して、一連のベクトルに K 個の最近傍を使用する必要があります。sckits Learnを使用してそれを達成するにはどうすればよいですか? 見つけましsklearn.neighbors.KNeighborsClassifierたが、ユーザー定義メトリックのオプションを見つけることができませんでした。現在、最新バージョンの scikits Learn 0.11 を使用しています。

4

1 に答える 1

3

事前に計算された、または遅延計算されたユーザー定義の距離関数を kNN モデルに渡すことは (まだ?) できません。

ただし、マスター ブランチでは、p-ミンコフスキー距離に任意の p を使用できるようになりました。

https://github.com/scikit-learn/scikit-learn/pull/742

ブルート フォース法で任意のユーザー定義の距離関数を渡すことは非常に簡単ですが、ボール ツリーの実装 (低次元データの場合) を一般的なケースに簡単に適用することはできません。

また、まばらな正のデータとコサインの類似性については、逆インデックスの方が優れたデータ構造になります

于 2012-04-13T09:06:01.153 に答える