私は150の実験物質を持っています。これらの物質のそれぞれについて、80 の特性が別々に測定されました。PCA を適用してその PC を計算し、最初の 3 つのコンポーネントを決定しました。次に、R ソフトウェア (www.R-project.org) で k-means クラスタリングを低次元データに 1000 回反復して適用し、個人をそれぞれのそれぞれの人口。
誰でもこれを行う方法を見ることができますか? ありがとう
http://www.statmethods.net/advstats/cluster.htmlデータをクラスター化するための簡単な例を提供します。
あなたの質問について:
いくつかのランダムな正規データと、Kmeans クラスタリングに適合するいくつかの単純なコードを検討してください。3 つのクラスターがこのデータに適合することに注意してください (純粋に恣意的に)。
data = matrix(rnorm(450),ncol=3)
fit = kmeans(data, centers = 3, iter.max = 1000)
cluster.data = data.frame(data, fit$cluster)
これはあなたの質問に答えましたか?