1

大きなデータ マトリックス (33183x1681) があり、各行は 1 つの観測に対応し、各列は変数に対応しています。

R の PAM 関数を使用して K-medoids クラスタリングを適用し、PAM 関数で利用可能な組み込みプロットを使用してクラスタリング結果を視覚化しようとしました。このエラーが発生しました:

Error in princomp.default(x, scores = TRUE, cor = ncol(x) != 2) :
cannot use cor=TRUE with a constant variable

この問題は、クラスター化しようとしているデータマトリックスの次元が高いためだと思います。

この問題に取り組むための考え/アイデアはありますか?

4

1 に答える 1

6

R のすべてのバージョンに同梱されているclara()パッケージクラスターの関数を確認してください。

library("cluster")
## generate 500 objects, divided into 2 clusters.
x <- rbind(cbind(rnorm(200,0,8), rnorm(200,0,8)),
           cbind(rnorm(300,50,8), rnorm(300,50,8)))
clarax <- clara(x, 2, samples=50)
clarax

> clarax
Call:    clara(x = x, k = 2, samples = 50) 
Medoids:
         [,1]       [,2]
[1,] -1.15913  0.5760027
[2,] 50.11584 50.3360426
Objective function:  10.23341
Clustering vector:   int [1:500] 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ...
Cluster sizes:           200 300 
Best sample:
 [1]  10  17  45  46  68  90  99 150 151 160 184 192 232 238 243 250 266 275 277
[20] 298 303 304 313 316 327 333 339 353 358 398 405 410 411 421 426 429 444 447
[39] 456 477 481 494 499 500

Available components:
 [1] "sample"     "medoids"    "i.med"      "clustering" "objective" 
 [6] "clusinfo"   "diss"       "call"       "silinfo"    "data"

で実行されるクラスタリングを に近いまたは同一にするために、 clara()( ?clara) のヘルプと引用されている参考文献を詳細に調べる必要があることに注意してください。clara()pam()

于 2012-10-16T10:41:30.867 に答える