5

重複の可能性:
k-meansクラスタリングを使用する場合、kを決定するにはどうすればよいですか?

データについて知らない場合、最初にKを選択するにはどうすればよいですか?

誰かがKを選ぶのを手伝ってくれませんか。

ありがとうNavin

4

2 に答える 2

0

基本的な考え方は、サンプルデータのクラスタースコアを評価することです。通常、クラスター内の距離とクラスター間の距離です。この測定値が多ければ多いほど、クラスタリングが向上します。この測定値に基づいて、最適なclustringパラメーターを選択できます。指標の1つはここにありますhttp://alias-i.com/lingpipe/docs/api/com/aliasi/cluster/ClusterScore.html

于 2011-06-03T07:04:55.557 に答える
-8

真剣に、あなたは何を知りたいですか?番号を教えてほしいですか?または、最適なものを見つける方法はk? k-means に関する本やその他のリソースを読む必要があります。そこでカバーされていると確信しています。

それについてウィキペディアに次のような記述があります。

http://en.wikipedia.org/wiki/Determining_the_number_of_clusters_in_a_data_set

アルゴリズムを使用する前に、それについて読んでください。

于 2011-06-02T09:34:31.577 に答える