2

「hclust」を使用して、混合データの階層分類を開始しました。ただし、結果には、各クラスターの変数の重要性に関する詳細は含まれていません。そのため、これらすべての詳細を示す「HCPC」を使用して分類を行いました。

私の質問は次のとおりです。2 つの階層分類の結果が異なるのはなぜですか。(たとえば、最初の分類では、最初のクラスターに 881 人の個人がいますが、2 番目の分類の最初のクラスターには 679 人の個人がいます)

dtf.year <- read.table(file="studies/dtf.year.txt", sep="\t", header=T)

#hclust
library(ade4)
year.afdm <- dudi.mix(dtf.year,scannf=F,nf=2)
dist.year <- dist(year.afdm$li[,1:2],method="euclidian")
dist.year <- dist.year^2
year.tree <- hclust(dist.year,method="ward.D") #I also tried ward.D2
year.clusters <- cutree(year.tree, k=3)
table(year.clusters)

>   1   2   3 
881 225 535 

#HCPC
library(FactoMineR)
year.afdm <- FAMD(dtf.year, ncp=2)
year.tree2 <- HCPC(year.afdm , method="ward",order=FALSE)
table(year.tree2$data.clust$clust)

>   1   2   3 
679 267 695

どんな助けでも大歓迎です!

ご多幸をお祈り申し上げます、Tang'

4

0 に答える 0