合計 8 列で構成されるデータセット (スケーリング済み) があります。
- 各観測が属する割り当てられたクラスターを示す最初の列、
- および、7 つの従属変数 (それぞれ異なる列にあります)。
次のブログ ( http://blog.datascienceheroes.com/short-lesson-on-cluster-analysis/ )に示されているように、R の座標プロットを使用してクラスタリングの視覚化を開発したいと考えています。
誰でもこれで私を助けることができますか?
合計 8 列で構成されるデータセット (スケーリング済み) があります。
次のブログ ( http://blog.datascienceheroes.com/short-lesson-on-cluster-analysis/ )に示されているように、R の座標プロットを使用してクラスタリングの視覚化を開発したいと考えています。
誰でもこれで私を助けることができますか?
多くのオプション。あなたができる
library(GGally)
ggparcoord(aggregate(mtcars, list(as.factor(cutree(hclust(dist(mtcars)), k = 4))), mean), columns=-1, groupColumn=1)
また
library(parcoords)
parcoords(
aggregate(mtcars, list(cutree(hclust(dist(mtcars)), k = 4)), mean),
color = list( colorScale = htmlwidgets::JS('d3.scale.category10()'), colorBy = "Group.1")
)
parcoords(
transform(mtcars, cluster = cutree(hclust(dist(mtcars)), k = 4)),
color = list( colorScale = htmlwidgets::JS('d3.scale.category10()'), colorBy = "cluster")
)
関数 you need( plot_clus_coord
) hereのコードがあります。