1

多数の X 変数と Y 変数のペアと、それらのクラスター メンバーシップの列があります。クラスターのメンバーシップ (グループ) は常に正しいとは限りません (クラスター化アルゴリズムの完全性の制限)。クラスターを対話的に視覚化し、クラスターのメンバーシップを識別されたポイントに操作したいと考えています。

私は rggobi を試してみましたが、以下が到達できたポイントです (rggobi / ggobi を使用する必要があるという意味ではありません。より良いオプションが利用可能な場合は、提案してください)。

# data
set.seed (1234)
c1 <- rnorm (40, 0.1, 0.02); c2 <- rnorm (40, 0.3, 0.01)
c3 <- rnorm (40, 0.5, 0.01); c4 <- rnorm (40, 0.7, 0.01)
c5 <- rnorm (40, 0.9, 0.03)
Yv <- 0.3 + rnorm (200, 0.05, 0.05)
myd <- data.frame (Xv = round (c(c1, c2, c3, c4, c5), 2), Yv = round (Yv, 2),
 cltr = factor (rep(1:5, each = 40)))

require(rggobi)
g <- ggobi(myd)
display(g[1], vars=list(X="Xv", Y="Yv"))

ここに画像の説明を入力

cltr変数で色分けされた 5 つのクラスターを確認できます。外れ値であるポイントを手動で特定し、それらの値を cltr 変数で NA にしたいと考えています。そのようなメンバーシップの関連付けを解除してファイルに書き込む簡単な方法はありますか。

4

1 に答える 1

1

identifyポイントのインデックスを手動で取得しようとすることができます。

## use base::plot
plot(myd$Xv, myd$Yv, col=myd$cltr)

exclude <- identify(myd$Xv, myd$Yv) ## left click on the points you want to exclude (right click to stop/finish)

myd$cltr[exclude] <- NA
于 2013-05-11T15:29:02.747 に答える