0

Python での Scipy によるクラスタリングについて少し混乱しています。ここに私のソースコードがあります:

import scipy.spatial.distance as dist
import numpy, scipy

dataMatrix = numpy.array(matrix)
distMatrix = dist.pdist(dataMatrix, 'euclidean')
distSquareMatrix = dist.squareform(distMatrix)

Y = scipy.cluster.hierarchy.linkage(distSquareMatrix, method='complete')

クラスタリングの入力として「distMatrix」または平方フォーム「distSquareMatrix」を使用する必要がありますか? 他の投稿で両方の方法を見たからです。しかし、出力は異なります。今、私は何を選択しなければならないのか分かりません。

4

1 に答える 1

4

で変換せずに、距離行列を圧縮形式で渡す必要がありますsquareform。このsquareform関数は、距離行列を自分でより簡単に 2D 配列として操作したい場合に便利です。これらのscipy.cluster.hierarchy関数は、約 2 倍のメモリを節約する目的で圧縮形式を使用します。

これが役立つことを願っています。

于 2013-11-09T17:40:33.663 に答える