したがって、基本的には、Pythonモジュールのscipy-clusterを使用して多くのデータポイントをプロットします。しきい値が与えられた場合に各クラスターの代表を与える方法/関数、または必要な代表の数はありますか?理想的には、各代表者は、それが属するクラスターの中心に最も近い距離を持っている必要があります。
編集:各クラスターの重心に最も近いデータポイントを探しています。
したがって、基本的には、Pythonモジュールのscipy-clusterを使用して多くのデータポイントをプロットします。しきい値が与えられた場合に各クラスターの代表を与える方法/関数、または必要な代表の数はありますか?理想的には、各代表者は、それが属するクラスターの中心に最も近い距離を持っている必要があります。
編集:各クラスターの重心に最も近いデータポイントを探しています。
scipy-clusterを回避する方法はよくわかりませんが、重心座標が得られるようです。その情報とクラスター内のどのポイントに関する知識を考えると、クラスター内の各ポイントの重心からの距離を計算するのは簡単なはずです。計算がクラスタリングに使用したのと同じ距離メトリック(おそらくユークリッド距離)に基づいていることを確認してください。
Scipy-clusterは、各重心の座標を提供し、各クラスター内のポイントを識別します。それがscipy.cluster.vq.py_vq
できたら、観測値と重心の間の距離が得られると思います。