30

目的関数に基づいて両方のパフォーマンスを比較できるかどうかを確認しようとしていますか?

4

4 に答える 4

28

ところで、Fuzzy-C-Means (FCM) クラスタリング アルゴリズムはSoft K-Meansとしても知られています。

目的関数は実質的に同一ですが、唯一の違いは、各クラスターへの特定の点の帰属のパーセンテージを表すベクトルの導入です。このベクトルは、より強い接続をより重要視する (逆に、より弱い接続の重みを最小化する) ことを目的とした「剛性」指数に適用されます。ちなみに、剛性係数が無限大になる傾向がある場合、結果のベクトルはバイナリ行列になるため、FCM モデルは K-Means のモデルと同じになります。

ポイントが割り当てられていないクラスターで発生する可能性のある問題を除いて、無限の剛性係数をシミュレートすることにより (=ベクトルの累乗の代わりに、ベクトルの最大値を 1 にし、他の値をゼロにします)。もちろん、これは K-Means を実行する非常に非効率的な方法です。なぜなら、アルゴリズムは真の FCM と同じ数の演算を実行しなければならないからです (1 と 0 の値のみの場合、計算は単純化されますが、複雑さは軽減されません)。

したがって、パフォーマンスに関しては、FCM は各ポイント、各次元に対して k (つまり、クラスターの数) の乗算を実行する必要があります (剛性を考慮に入れるための累乗もカウントしません)。これに加えて、近接ベクトルの計算と管理に必要なオーバーヘッドにより、FCM が単純な K-Means よりも非常に遅い理由が説明されます。

しかし、FCM/Soft-K-Means は、たとえば細長いクラスターの場合 (他の次元では一貫性のあるポイントが特定の次元または 2 次元に沿って分散する傾向がある場合)、Hard-K-Means よりも「愚か」ではなく、それが理由です。まだあります;-)

私の元の返信から:

また、私はこれについて考えましたが、「数学的」な考えはしていません。FCM はハード K 平均よりも速く収束し、FCM のより大きな計算要件を多少相殺する可能性があります。

2018 年 5 月の編集:

FCM のより速い収束率についての私の上記の予感をサポートする、私が特定できる評判の良い調査は実際にはありません。ベンジャミン・ホーン、正直に言ってくれてありがとう;-)

于 2010-02-27T03:02:22.827 に答える
19

K-Means クラスタリングFuzzy-C Means クラスタリングは、アプローチが非常に似ています。主な違いは、Fuzzy-C 平均クラスタリングでは、各ポイントに特定のクラスターに関連付けられた重みがあるため、ポイントが「クラスター内」にあるわけではなく、クラスターとの関連性が弱いまたは強いことです。は、クラスターの中心までの逆距離によって決まります。

Fuzzy-C 平均は、実際にはより多くの作業を行っているため、K 平均よりも遅くなる傾向があります。各ポイントは各クラスターで評価され、各評価にはより多くの操作が含まれます。K-Means は距離計算を行うだけでよいのに対し、ファジー c は完全な逆距離重み付けを行う必要があります。

于 2010-02-27T01:48:32.727 に答える
2

人々は技術的に書いており、それぞれの答えはよく書かれています。でも言いたいことは素人の言葉で同じです。K は、データセット全体を K 個のクラスターにクラスター化することを意味し、データは 1 つのクラスターのみに属する必要があります。ファジー c-means は k 個のクラスターを作成し、各データを各クラスターに割り当てますが、データがそのクラスターにどれだけ強く属しているかを定義する要因になります。

于 2016-07-29T06:24:16.920 に答える