1

球体に分散された一連のデータがあり、scikit-learn によって分散された関数 DBS​​CAN にどのメトリックを指定する必要があるかを理解しようとしています。ポイントの分布に使用されるメトリックはユークリッドではないため、ユークリッド メトリックにすることはできません。sklearn パケットには、そのような場合に実装されたメトリックがありますか、またはデータを小さなサブセットに分割するのが (長くて退屈な場合) 最も簡単な方法ですか?

PS私はpythonの初心者です

PPS メトリックを「事前計算」する場合、事前計算されたデータをどのような形式で提出する必要がありますか? このような?

0 - イベント 1 - イベント 2 - ...

イベント1 - 0 - 距離(イベント1,イベント2) - ...

イベント 2 - 距離 (イベント 1、イベント 2) - 0

助けてください?

4

1 に答える 1

0

試しましたmetric="precomputed"か?

次に、データの代わりに距離行列をDBSCAN.fit関数に渡します。

ドキュメントから:

X配列 [n_samples, n_samples] または [n_samples, n_features] :

サンプル間の距離の配列、または特徴配列。メトリックが「事前計算済み」として指定されていない限り、配列は特徴配列として扱われます。

于 2014-11-16T23:09:46.007 に答える