2

したがって、基本的には、Pythonモジュールのscipy-clusterを使用して多くのデータポイントをプロットします。しきい値が与えられた場合に各クラスターの代表を与える方法/関数、または必要な代表の数はありますか?理想的には、各代表者は、それが属するクラスターの中心に最も近い距離を持っている必要があります。

編集:各クラスターの重心に最も近いデータポイントを探しています。

4

2 に答える 2

1

scipy-clusterを回避する方法はよくわかりませんが、重心座標が得られるようです。その情報とクラスター内のどのポイントに関する知識を考えると、クラスター内の各ポイントの重心からの距離を計算するのは簡単なはずです。計算がクラスタリングに使用したのと同じ距離メトリック(おそらくユークリッド距離)に基づいていることを確認してください。

于 2012-06-19T05:13:56.013 に答える
1

Scipy-clusterは、各重心の座標を提供し、各クラスター内のポイントを識別します。それがscipy.cluster.vq.py_vqできたら、観測値と重心の間の距離が得られると思います。

于 2012-07-04T18:29:00.757 に答える