14

私は自己組織化マップについて読んでおり、アルゴリズムを理解しています (と思います) が、まだ何かがわかりません。

訓練されたネットワークをどのように解釈しますか?

次に、たとえば分類タスクに実際にどのように使用しますか(トレーニングデータでクラスタリングを行った後)?

私が見つけたと思われるすべての資料 (印刷物およびデジタル) は、アルゴリズムのトレーニングに焦点を当てています。決定的な何かが欠けている可能性があると思います。

よろしく

4

1 に答える 1

26

SOMs は主に次元削減アルゴリズムであり、分類ツールではありません。それらは、同じようPCAに、または同様の方法で次元削減に使用されます (一度トレーニングすると、どのニューロンが入力によってアクティブ化されているかを確認し、このニューロンの位置を値として使用できます)。唯一の実際の違いは、特定のトポロジーを維持する能力です。出力表現。

したがって、SOM実際に生成されるのは、入力空間Xから縮小空間へのマッピングですY(最も一般的なのは、Y2 次元空間を作成する 2D ラティスです)。実際の分類を実行するには、このマッピングを使用してデータを変換し、他の分類モデル ( SVM、ニューラル ネットワーク、デシジョン ツリーなど) を実行する必要があります。

つまり、 -は、データの他の表現SOMを見つけるために使用されます。人間によるさらなる分析が容易な表現 (ほとんどが 2 次元であり、プロットできるため) であり、さらなる分類モデルにとって非常に簡単です。これは、高次元データを視覚化し、「何が起こっているか」を分析し、一部のクラスがどのように幾何学的にグループ化されているかなどを視覚化するための優れた方法です。しかし、人工ニューラル ネットワークや成長するニューラル ガスなどの他のニューラル モデルと混同しないでください。は非常によく似た概念ですが、直接的なデータ クラスタリングを提供します)、目的が異なるためです。

もちろんSOM、分類に s を直接使用することもできますが、これは元のアイデアの変更であり、他のデータ表現が必要であり、一般に、その上に他の分類子を使用する場合ほどうまく機能しません。

編集

トレーニング済みを視覚化する方法は少なくともいくつかありますSOM

  • のニューロンを入力空間の点としてレンダリングしSOM、トポロジー的に近いものを接続するエッジを使用できます (これは、入力空間の次元数が 2 ~ 3 のように小さい場合にのみ可能です)。
  • SOMのトポロジでデータ クラスを表示します。データに数字のラベルが付けられている場合、いくつかの色をそれらにバインド{1,..k}できます。次に、各データ ポイントについて、対応するニューロンを計算し、このラベルの色をニューロンに追加します。すべてのデータが処理されたら、それぞれのニューロンをトポロジ内の元の位置にプロットし、色はそれに割り当てられた色の集合 (平均など) です。このアプローチでは、2D グリッドのような単純なトポロジを使用すると、データの優れた低次元表現が得られます。次の画像では、3 番目から最後までのサブ画像がこのような視覚化の結果であり、色はラベル 1青を意味します。kblueredSOMSOMred("yes" answer) andmeans label2` (「いいえ」の答え)
  • onc は、接続されている各ニューロンの距離を計算し、それをSOMのマップにプロットすることで、ニューロン間の距離を視覚化することもできます (上の視覚化の 2 番目のサブイメージ)。
  • 何らかのクラスタリング アルゴリズム (K-means など) を使用してニューロンの位置をクラスタ化し、クラスタ ID を色として視覚化できます (最初のサブイメージ)。

ソース:ウィキペディア

于 2013-08-14T14:44:30.503 に答える