クラスター分析を行っており、剪定されたツリーの葉にある特定の変数の出現回数を数えたいと考えています。以下は、剪定されたツリーに 3 つのブランチしかない単純化された例です。私は今、3 つの異なる枝/葉の As と B の数を知りたいと思っています。どうすれば入手できますか?
rm(list=ls(all=TRUE))
mylabels <- matrix(nrow=1, ncol = 20)
mylabels[1,1:10] <- ("A")
mylabels[1,11:20] <- ("B")
myclusterdata <- matrix(rexp(100, rate=.1), ncol=100, nrow=20)
rownames(myclusterdata)<-mylabels
hc <- hclust(dist(myclusterdata), "ave")
memb <- cutree(hc, k = 3)
cent <- NULL
for(k in 1:3){
cent <- rbind(cent, colMeans(myclusterdata[memb == k, , drop = FALSE]))
}
hc1 <- hclust(dist(cent)^2, method = "cen", members = table(memb))
# whole tree
plot(as.dendrogram(hc),horiz=T)
# pruned tree (only 3 branches)
plot(as.dendrogram(hc1),horiz=T)