同じ初期設定で同じデータセットにK-means法とシーケンシャルK-means法を適用した場合、同じ結果が得られますか?理由を説明してください。
個人的には答えはノーだと思います。シーケンシャルK-meansによって得られる結果は、データポイントの表示順序によって異なります。そして、終了条件は同じではありません。
ここに、2つのクラスタリングアルゴリズムの擬似コードを添付します。
K-means
Make initial guesses for the means m1, m2, ..., mk
Until there is no change in any mean
Assign each data point to the cluster whose mean is the nearest.
Calculate the mean of each cluster.
For i from 1 to k
Replace mi with the mean of all examples for cluster i.
end_for
end_until
シーケンシャルK-means
Make initial guesses for the means m1, m2, ..., mk
Set the counts n1, n2, ..., nk to zero
Until interrupted
Acquire the next example, x
If mi is closest to x
Increment ni
Replace mi by mi + (1/ni)*(x - mi)
end_if
end_until