コサイン類似度メトリックとその他のユーザー定義メトリックを使用して、一連のベクトルに K 個の最近傍を使用する必要があります。sckits Learnを使用してそれを達成するにはどうすればよいですか? 見つけましsklearn.neighbors.KNeighborsClassifier
たが、ユーザー定義メトリックのオプションを見つけることができませんでした。現在、最新バージョンの scikits Learn 0.11 を使用しています。
2332 次
1 に答える
3
事前に計算された、または遅延計算されたユーザー定義の距離関数を kNN モデルに渡すことは (まだ?) できません。
ただし、マスター ブランチでは、p-ミンコフスキー距離に任意の p を使用できるようになりました。
https://github.com/scikit-learn/scikit-learn/pull/742
ブルート フォース法で任意のユーザー定義の距離関数を渡すことは非常に簡単ですが、ボール ツリーの実装 (低次元データの場合) を一般的なケースに簡単に適用することはできません。
また、まばらな正のデータとコサインの類似性については、逆インデックスの方が優れたデータ構造になります。
于 2012-04-13T09:06:01.153 に答える