SOMでデータを収集して整理したら、クラスターを特定するにはどうすればよいですか?
(アイテムは、多くの特性を使用して集約およびクラスター化されます-10以上)
具体的には、クラスターの「中心」を見つけたいので、「中心」ノードを取得します。
SOMでデータを収集して整理したら、クラスターを特定するにはどうすればよいですか?
(アイテムは、多くの特性を使用して集約およびクラスター化されます-10以上)
具体的には、クラスターの「中心」を見つけたいので、「中心」ノードを取得します。
比較的小さなマップを使用して、各ノードをクラスターと見なすことができますが、これは最適とは言えません。自動クラスター検出方法を適用したい場合は、必ずお読みください。
同様の参考文献を検索します。
より洗練されたバージョンのSOMアルゴリズム(マルチレベル、自己成長など)を使用することもできます。
いずれにせよ、「正しい」数のクラスターを見つける問題には有限の解決策がないことに注意してください。
私の知る限り、SOMは主にデータ駆動型の次元削減およびデータ圧縮方式です。したがって、データはクラスター化されません。実際には、投影でクラスターを広げる傾向がある場合があります(つまり、クラスターを複数のセルに分割します)。
ただし、一部のデータセットでは次のいずれかでうまく機能する場合があります。
次に、変換されたデータに対して通常のクラスタリングアルゴリズムを実行します。
古い質問で同じ問題が発生し、自己組織化マップによる多変量データのクラスター数の推定の実装に成功したので、共有したいと思いました。
リンクされたアルゴリズムは、Uマトリックスを使用して個々のクラスターの境界を強調表示し、ウォーターシェディングと呼ばれる画像処理アルゴリズムを使用してコンポーネントを識別します。これが正しく機能するためには、u-matrixの領域が量子化の解像度内で凹状である必要があります(バイナリイメージに変換すると、単に塗りつぶしを使用して領域を識別します)。