1

このデータセット data1 (ポストスケーリングと PCA) があるとします。

            F1    F2     F3  F4   F5 ... F21
1          0.28  2.29  5.64 1.04 3.92    1065
2          0.26  1.28  4.38 1.05 3.40    1050
3          0.30  2.81  5.68 1.03 3.17    1185
4          0.24  2.18  7.80 0.86 3.45    1480
5          0.39  1.82  4.32 1.04 2.93     735
.
.
.
1000       0.34  1.97  6.75 1.05 2.85    1450

以下を使用して、データセットに対して k-means クラスター分析を行いました。

Clusters <- kmeans(data1, 5, nstart = 25)
data1 <- data.frame(data1)
data1 <- data1 %>% mutate(Cluster = Clusters$cluster)

次に、別のデータセットから文字型の行名を挿入しました。

rownames(data1) <- data2$Name

次に、ラベルの重複を避けるために使用しました

p1 <- autoplot(Clusters, data = data1, frame = TRUE, label = F, x=1, y=2)
p2 <- p1 + geom_text_repel(aes(label = rownames(data1)))

これを返したのは

500 を超えるデータ ポイントがあるため、予想どおりラベルが重なって読み取れません。データポイントをクリックまたはホバーしたときにのみラベルが表示される場合にラベルを付ける方法があるかどうか疑問に思っていました。または、その他のソリューションを歓迎します。ありがとう

4

1 に答える 1