1

これは、k-meansクラスタリングアルゴリズムに関する質問です。以下の点とデータのクラスタリングS1があります。このクラスタリングに関連する合計エラーを計算する方法を誰かに教えてもらえますか?厳密にプログラミングの質問ではないことは知っていますが、アルゴリズムには必要です。答えは4/3だと思いますが、どうやって計算すればいいのかわかりません。誰か助けてもらえますか?

x1= (2.0,1.0)
x2= (2.0,2.0)
x3= (1.0,2.0)

S1={ x1, x2, x3 }
4

2 に答える 2

1

エラーを計算する方法はたくさんあります。これが1つです。

まず、集合の重心C1 =(x1 + x2 + x3)/3を計算します。次に、重心からの距離の合計として誤差を計算します:E1 = d(C1-x1)+ d(C1-x2)+ d(C1-x3)。

于 2010-05-01T21:20:07.927 に答える
1

私は過去数週間で似たようなものを探さなければなりませんでした。ほとんどのものと同様に、正しい名前を見つけることは大いに役立ちました。クラスター妥当性インデックスを探しています。アルゴリズム(および関連する数学)の有用な情報源は、Gan、Ma、およびWuによる「データクラスタリング理論、アルゴリズム、およびアプリケーション」の第17章であることがわかりました。アマゾンから100ドル以上で安くはありませんが、私は本の残りの部分が役に立つと思います。これらの指標の多くをカバーしていますが、長所と短所についての十分な議論が不足しているため、オンライン検索が必要です。

最後に、DaviesBouldinIndexとDunn'sIndexを試しました。Dunnの方がうまく機能しましたが、計算に非常に時間がかかりました。実際の直径ではなく、重心間距離(コンポーネントのポイントポイント距離ではなく)と重心からの最大半径を使用する簡略化されたバージョンに落ち着きました。これまでのところ、これは私にとってうまく機能しています。

さまざまな指標のほとんどは、クラスターのサイズと分離の尺度を使用しています。

于 2010-10-21T01:24:04.473 に答える