dbscan
パッケージで使用fpc
すると、次の出力を取得できます。
dbscan Pts=322 MinPts=20 eps=0.005
0 1
seed 0 233
border 87 2
total 87 235
しかし、クラスターの中心 (最も多くのシードを持つクラスターの平均) を見つける必要があります。誰でもこれを進める方法を教えてもらえますか?
dbscan
パッケージで使用fpc
すると、次の出力を取得できます。
dbscan Pts=322 MinPts=20 eps=0.005
0 1
seed 0 233
border 87 2
total 87 235
しかし、クラスターの中心 (最も多くのシードを持つクラスターの平均) を見つける必要があります。誰でもこれを進める方法を教えてもらえますか?
DBSCAN は任意の形状のクラスターを探すため、平均がクラスターの外側にある可能性があることを理解する必要があります。したがって、DBSCAN クラスターの手段を見ることはあまり賢明ではありません。
選択したクラスター ID を使用して元のデータにインデックスを付けるだけです。その後、サブセットに対してさらに必要な処理を簡単に行うことができます。次に例を示します。
library(fpc)
n = 100
set.seed(12345)
data = matrix(rnorm(n*3), nrow=n)
data.ds = dbscan(data, 0.5)
> data.ds
dbscan Pts=100 MinPts=5 eps=0.5
0 1 2 3
seed 0 1 3 1
border 83 4 4 4
total 83 5 7 5
> colMeans(data[data.ds$cluster==0, ])
[1] 0.28521404 -0.02804152 -0.06836167