このデータセット data1 (ポストスケーリングと PCA) があるとします。
F1 F2 F3 F4 F5 ... F21
1 0.28 2.29 5.64 1.04 3.92 1065
2 0.26 1.28 4.38 1.05 3.40 1050
3 0.30 2.81 5.68 1.03 3.17 1185
4 0.24 2.18 7.80 0.86 3.45 1480
5 0.39 1.82 4.32 1.04 2.93 735
.
.
.
1000 0.34 1.97 6.75 1.05 2.85 1450
以下を使用して、データセットに対して k-means クラスター分析を行いました。
Clusters <- kmeans(data1, 5, nstart = 25)
data1 <- data.frame(data1)
data1 <- data1 %>% mutate(Cluster = Clusters$cluster)
次に、別のデータセットから文字型の行名を挿入しました。
rownames(data1) <- data2$Name
次に、ラベルの重複を避けるために使用しました
p1 <- autoplot(Clusters, data = data1, frame = TRUE, label = F, x=1, y=2)
p2 <- p1 + geom_text_repel(aes(label = rownames(data1)))
500 を超えるデータ ポイントがあるため、予想どおりラベルが重なって読み取れません。データポイントをクリックまたはホバーしたときにのみラベルが表示される場合にラベルを付ける方法があるかどうか疑問に思っていました。または、その他のソリューションを歓迎します。ありがとう