data-mining - K-MeansアルゴリズムでKを最適化する方法

Question

重複の可能性：
k-meansクラスタリングを使用する場合、kを決定するにはどうすればよいですか？

データについて知らない場合、最初にKを選択するにはどうすればよいですか？

誰かがKを選ぶのを手伝ってくれませんか。

ありがとうNavin

score 0 · Accepted Answer

基本的な考え方は、サンプルデータのクラスタースコアを評価することです。通常、クラスター内の距離とクラスター間の距離です。この測定値が多ければ多いほど、クラスタリングが向上します。この測定値に基づいて、最適なclustringパラメーターを選択できます。指標の1つはここにありますhttp://alias-i.com/lingpipe/docs/api/com/aliasi/cluster/ClusterScore.html

score -8 · Accepted Answer

真剣に、あなたは何を知りたいですか？番号を教えてほしいですか？または、最適なものを見つける方法はk? k-means に関する本やその他のリソースを読む必要があります。そこでカバーされていると確信しています。

それについてウィキペディアに次のような記述があります。

http://en.wikipedia.org/wiki/Determining_the_number_of_clusters_in_a_data_set

アルゴリズムを使用する前に、それについて読んでください。

data-mining - K-MeansアルゴリズムでKを最適化する方法

2 に答える 2

Related

Reference