1

hclust を使用して一部のデータのクラスター樹形図を生成しましたが、すべての対になったクラスター、つまり 2 つのデータ (一緒にクラスター化される最初のデータ) のみを構成するすべてのクラスターを分離する必要があります。 「より高い」ブランチ上の他のデータとクラスター化されています。どうすればそれができるか知っている人はいますか?

添付の画像で分離したいクラスターを強調表示しましたが、うまく説明できれば幸いです。

デンドログラム

クラスターの内容を比較できるように、それらのクラスター内のすべての対になったデータを分離できるようにしたいと考えています。たとえば、特定のタイプのデータが含まれているものを確認します。

4

1 に答える 1

3

FWIW、次のように「フォーク」を抽出できます。

hc <- hclust(dist(USArrests), "ave")
plot(hc)

ここに画像の説明を入力

res <- list()
invisible(dendrapply(as.dendrogram(hc), function(x) {
  if (attr(x, "members")==2) 
    if (all(sapply(x[1:2], is.leaf))) 
      res <<- c(res, list(c(attr(x[[1]], "label"), attr(x[[2]], "label"))))
  x
}))
head( do.call(rbind, res) )
#     [,1]          [,2]            
# [1,] "Florida"     "North Carolina"
# [2,] "Arizona"     "New Mexico"    
# [3,] "Alabama"     "Louisiana"     
# [4,] "Illinois"    "New York"      
# [5,] "Michigan"    "Nevada"        
# [6,] "Mississippi" "South Carolina"

(結果の最初の 6 行のみ)

于 2016-03-08T14:22:07.817 に答える