このページを見てください:
ここにも同様の質問があります
コフェネティック相関を使用して、2 つのデンドログラム間の類似性を測定できるようです。しかし、現在Rにはこの目的のための機能はないようです。
2014 年 9 月 18 日の編集:パッケージ内
のcophenetic
関数はstats
、コフェネティック非類似度行列を計算できます。相関関係は、関数を使用して計算できますcor
。@Talが指摘したように、as.dendrogram
関数は異なる順序でツリーを返しました。これにより、樹状図の結果に基づいて相関を計算すると、間違った結果が生じます。パッケージ内の関数cor_cophenetic
関数の例に示すように:dendextend
set.seed(23235)
ss <- sample(1:150, 10 )
hc1 <- iris[ss,-5] %>% dist %>% hclust("com")
hc2 <- iris[ss,-5] %>% dist %>% hclust("single")
dend1 <- as.dendrogram(hc1)
dend2 <- as.dendrogram(hc2)
# cutree(dend1)
cophenetic(hc1)
cophenetic(hc2)
# notice how the dist matrix for the dendrograms have different orders:
cophenetic(dend1)
cophenetic(dend2)
cor(cophenetic(hc1), cophenetic(hc2)) # 0.874
cor(cophenetic(dend1), cophenetic(dend2)) # 0.16
# the difference is becasue the order of the distance table in the case of
# stats:::cophenetic.dendrogram will change between dendrograms!