11

SOMでデータを収集して整理したら、クラスターを特定するにはどうすればよいですか?

(アイテムは、多くの特性を使用して集約およびクラスター化されます-10以上)

具体的には、クラスターの「中心」を見つけたいので、「中心」ノードを取得します。

4

3 に答える 3

6

比較的小さなマップを使用して、各ノードをクラスターと見なすことができますが、これは最適とは言えません。自動クラスター検出方法を適用したい場合は、必ずお読みください。

自己組織化マップのクラスタリング

同様の参考文献を検索します。

より洗練されたバージョンのSOMアルゴリズム(マルチレベル、自己成長など)を使用することもできます。

いずれにせよ、「正しい」数のクラスターを見つける問題には有限の解決策がないことに注意してください。

于 2012-10-26T15:11:01.430 に答える
4

私の知る限り、SOMは主にデータ駆動型の次元削減およびデータ圧縮方式です。したがって、データはクラスター化されません。実際には、投影でクラスターを広げる傾向がある場合があります(つまり、クラスターを複数のセルに分割します)。

ただし、一部のデータセットでは次のいずれかでうまく機能する場合があります。

  • 完全なデータセットを処理する代わりに、SOMノード(割り当てられた要素の数で重み付けされた)でのみ作業します。SOMノードは大幅に小さくする必要があります。
  • 元の空間で作業する代わりに、SOMが表す低次元の空間で作業します

次に、変換されたデータに対して通常のクラスタリングアルゴリズムを実行します。

于 2012-10-27T07:36:07.100 に答える
3

古い質問で同じ問題が発生し、自己組織化マップによる多変量データのクラスター数の推定の実装に成功したので、共有したいと思いました。

リンクされたアルゴリズムは、Uマトリックスを使用して個々のクラスターの境界を強調表示し、ウォーターシェディングと呼ばれる画像処理アルゴリズムを使用してコンポーネントを識別します。これが正しく機能するためには、u-matrixの領域が量子化の解像度内で凹状である必要があります(バイナリイメージに変換すると、単に塗りつぶしを使用して領域を識別します)。

于 2014-06-18T10:55:55.000 に答える