私は宿題としてk-meansを実装しようとしています。私のエクササイズシートには、空のセンターに関する次のコメントがあります。
反復中に、クラスターセンターのいずれかにデータポイントが関連付けられていない場合は、ランダムなデータポイントに置き換えます。
それは私を少し混乱させます、最初に私が読んだウィキペディアまたは他の情報源はそれについて全く言及していません。さらに、「データに適切なkを選択する」という問題について読みました。空のクラスターに新しい中心を設定し始めた場合、アルゴリズムはどのように収束するはずです。
空のクラスターを無視すると、30〜40回の反復後に収束します。空のクラスターを無視するのは間違っていますか?