私は最近、k-Means記事のシングル パス シード選択アルゴリズムを読みましたが、次のようなアルゴリズムをよく理解していません。
- からまでの距離
DistをDist (i,j)表す距離行列を計算しますij - 番目の点から他のすべての点までの距離の合計で
Sumvあるを見つけます。Sumv (i)i iある点を見つけてmin (Sumv)設定するIndex = iCFirst を最初の重心として追加します- 各点について、 と の最も近い点の間の距離
xiに設定します。D (xi)xiC - からの最初の最も近い点
yの距離の合計として見つけますn/kIndex - 一意の整数を見つけて
i、D(x1)^2+D(x2)^2+...+D(xi)^2 >= y > D(x1)^2+D(x2)^2+...+D(x(i-1))^2 xiに追加Ck中央になるまで手順 5 ~ 8 を繰り返します
特にステップ 6 では、同じIndex(同じポイント) を何度も使用しますか、それとも から新しく追加されたポイントを使用しCますか? ステップ 8 については、iよりも大きくする必要があり1ますか?