ポイントのセットがあり、それらからクラスターが必要です。通常の k-means アルゴリズムの実行方法を知っています。しかし、「k」を入力として取りたくありません。1,3,4,50,60,70,1000,10002,10004 のようなポイントがある場合、アルゴリズムはそれらを 3 つのクラスターにクラスター化する必要があります C1: 1,3,4 C2: 50,60,70 C3: 1000,1002 ,1004 を満たすクラスター内要素間の距離は最小であり、クラスター間距離は最大でなければなりません。
1131 次
2 に答える
0
how-do-i-determine-k-when-using-k-means-clusteringとそこのリンクを参照してください。
于 2011-05-09T14:27:19.480 に答える
0
k の決定は、多くのクラスタリング アルゴリズムで繰り返される問題です。スペクトル クラスタリング (およびそのさまざまなアルゴリズムのいとこ) を検討して、その問題をある程度軽減することをお勧めします。ただし、多くのバージョンでは最終ステップとして k-means が使用され、振り出しに戻ります (ただし、すべてではありません)。
あるいは、上記の Denis によって提供された回答など、k の最適値を見つけるための多くのアプローチがあります。これはあなたの目的には十分かもしれません。
于 2011-05-09T16:19:11.087 に答える