6

私は、事前計算されたメトリックを使用して、Scikit-Learn の最近傍/半径分類を使用しています。つまり、ペアごとの距離の n_samples_train x n_samples_train 行列を分類器の適合メソッドに渡します。

なぜこれをしなければならないのか、今思うと。knn を使用した学習は単に「サンプルを保存する」ことを意味するはずですが、距離の計算は後で一般化中にのみ行う必要があります (もちろん、そのステップでは、トレーニング サンプルとテスト サンプルの間の距離行列を計算するので、サイズ n_samples_train x n_samples_test の行列)。

たとえば、SVM の場合、事前に計算された行列 (グラミアン、類似度行列) を smv.SVC オブジェクトの fit メソッドに渡します。次に、最適化が行われ、サポート ベクターが検出されます。そこでは、トレーニング中にそのマトリックスが絶対に必要です。

しかし、近隣/半径分類に適合する事前計算された行列が必要な理由はわかりません。

誰かが私に関連するヒントを教えてもらえますか?

scikit Learn を使用して knn のトレーニング マトリックスの計算を省略したいと思います。

最高の挨拶とありがとう。:-)

4

1 に答える 1