データについて知らない場合、最初にKを選択するにはどうすればよいですか?
誰かがKを選ぶのを手伝ってくれませんか。
ありがとうNavin
データについて知らない場合、最初にKを選択するにはどうすればよいですか?
誰かがKを選ぶのを手伝ってくれませんか。
ありがとうNavin
基本的な考え方は、サンプルデータのクラスタースコアを評価することです。通常、クラスター内の距離とクラスター間の距離です。この測定値が多ければ多いほど、クラスタリングが向上します。この測定値に基づいて、最適なclustringパラメーターを選択できます。指標の1つはここにありますhttp://alias-i.com/lingpipe/docs/api/com/aliasi/cluster/ClusterScore.html
真剣に、あなたは何を知りたいですか?番号を教えてほしいですか?または、最適なものを見つける方法はk
? k-means に関する本やその他のリソースを読む必要があります。そこでカバーされていると確信しています。
それについてウィキペディアに次のような記述があります。
http://en.wikipedia.org/wiki/Determining_the_number_of_clusters_in_a_data_set
アルゴリズムを使用する前に、それについて読んでください。