0

K-Means アルゴリズムを使用してクラスターを作成します。ご存知のように、K-means アルゴリズムにはパラメーターとしてクラスター数が必要です。私はクラスター数を 8 から 2 で開始し、すべてのループでクラスターのすべての C-Index を計算してから、これらの C-Indexes の平均を取得します。次に、C-Index avegares を比較し、最小の C-Index 平均を最高品質のクラスター数として選択します。それはクラスター数を検出するための本当の方法ですか?

4

1 に答える 1

1

クラスター数を検出する唯一の正しい方法はありません。次のgoogle 検索を参照してください。これは現在も活発な研究分野です。ウィキペディアの記事には、次のように書かれています。

k の正しい選択は、データ セット内のポイントの分布の形状とスケール、およびユーザーの希望するクラスタリングの解像度に応じて解釈されるため、しばしばあいまいです。

このように c-index を使用することが、ドメイン内のクラスター数を決定するのに適しているかどうかを判断できるのは、あなただけです。クラスタリングでの c-indexの使用に関する別の質問を参照してください。

于 2014-12-09T08:48:38.197 に答える