私は最近、k-Means記事のシングル パス シード選択アルゴリズムを読みましたが、次のようなアルゴリズムをよく理解していません。
- からまでの距離
Dist
をDist (i,j)
表す距離行列を計算しますi
j
- 番目の点から他のすべての点までの距離の合計で
Sumv
あるを見つけます。Sumv (i)
i
i
ある点を見つけてmin (Sumv)
設定するIndex = i
C
First を最初の重心として追加します- 各点について、 と の最も近い点の間の距離
xi
に設定します。D (xi)
xi
C
- からの最初の最も近い点
y
の距離の合計として見つけますn/k
Index
- 一意の整数を見つけて
i
、D(x1)^2+D(x2)^2+...+D(xi)^2 >= y > D(x1)^2+D(x2)^2+...+D(x(i-1))^2
xi
に追加C
k
中央になるまで手順 5 ~ 8 を繰り返します
特にステップ 6 では、同じIndex
(同じポイント) を何度も使用しますか、それとも から新しく追加されたポイントを使用しC
ますか? ステップ 8 については、i
よりも大きくする必要があり1
ますか?