私は自己組織化マップについて読んでおり、アルゴリズムを理解しています (と思います) が、まだ何かがわかりません。
訓練されたネットワークをどのように解釈しますか?
次に、たとえば分類タスクに実際にどのように使用しますか(トレーニングデータでクラスタリングを行った後)?
私が見つけたと思われるすべての資料 (印刷物およびデジタル) は、アルゴリズムのトレーニングに焦点を当てています。決定的な何かが欠けている可能性があると思います。
よろしく
私は自己組織化マップについて読んでおり、アルゴリズムを理解しています (と思います) が、まだ何かがわかりません。
訓練されたネットワークをどのように解釈しますか?
次に、たとえば分類タスクに実際にどのように使用しますか(トレーニングデータでクラスタリングを行った後)?
私が見つけたと思われるすべての資料 (印刷物およびデジタル) は、アルゴリズムのトレーニングに焦点を当てています。決定的な何かが欠けている可能性があると思います。
よろしく
SOM
s は主に次元削減アルゴリズムであり、分類ツールではありません。それらは、同じようPCA
に、または同様の方法で次元削減に使用されます (一度トレーニングすると、どのニューロンが入力によってアクティブ化されているかを確認し、このニューロンの位置を値として使用できます)。唯一の実際の違いは、特定のトポロジーを維持する能力です。出力表現。
したがって、SOM
実際に生成されるのは、入力空間X
から縮小空間へのマッピングですY
(最も一般的なのは、Y
2 次元空間を作成する 2D ラティスです)。実際の分類を実行するには、このマッピングを使用してデータを変換し、他の分類モデル ( SVM
、ニューラル ネットワーク、デシジョン ツリーなど) を実行する必要があります。
つまり、 -は、データの他の表現SOM
を見つけるために使用されます。人間によるさらなる分析が容易な表現 (ほとんどが 2 次元であり、プロットできるため) であり、さらなる分類モデルにとって非常に簡単です。これは、高次元データを視覚化し、「何が起こっているか」を分析し、一部のクラスがどのように幾何学的にグループ化されているかなどを視覚化するための優れた方法です。しかし、人工ニューラル ネットワークや成長するニューラル ガスなどの他のニューラル モデルと混同しないでください。は非常によく似た概念ですが、直接的なデータ クラスタリングを提供します)、目的が異なるためです。
もちろんSOM
、分類に s を直接使用することもできますが、これは元のアイデアの変更であり、他のデータ表現が必要であり、一般に、その上に他の分類子を使用する場合ほどうまく機能しません。
編集
トレーニング済みを視覚化する方法は少なくともいくつかありますSOM
。
SOM
、トポロジー的に近いものを接続するエッジを使用できます (これは、入力空間の次元数が 2 ~ 3 のように小さい場合にのみ可能です)。SOM
のトポロジでデータ クラスを表示します。データに数字のラベルが付けられている場合、いくつかの色をそれらにバインド{1,..k}
できます。次に、各データ ポイントについて、対応するニューロンを計算し、このラベルの色をニューロンに追加します。すべてのデータが処理されたら、それぞれのニューロンをトポロジ内の元の位置にプロットし、色はそれに割り当てられた色の集合 (平均など) です。このアプローチでは、2D グリッドのような単純なトポロジを使用すると、データの優れた低次元表現が得られます。次の画像では、3 番目から最後までのサブ画像がこのような視覚化の結果であり、色はラベル 1青を意味します。k
blue
red
SOM
SOM
red
("yes" answer) and
means label
2` (「いいえ」の答え)SOM
のマップにプロットすることで、ニューロン間の距離を視覚化することもできます (上の視覚化の 2 番目のサブイメージ)。