m*n 配列で階層クラスタリングを実行しようとしています。
- 入力配列 : 500 * 1000 (1000 特徴、500 観測)
- 自己定義の pdist 関数を使用して距離行列を計算する
- この距離行列をリンケージ関数にフィードします: clusters = sch.linkage(distanceMatrix,'single')
- フラットなクラスターを形成する: fc = sch.fcluster(clusters,cutoff,'distance')
これにより、いくつかのクラスターが得られます (カットオフ値 6.0 を使用して約 80)。とにかく、各クラスターに対応する 1000 個の機能も取得できるのでしょうか? (K-means クラスタリングを使用して重心の特徴を取得するように)。