0

ガウス混合モデルの概念を理解するから GMM の概念を読みました。それは私にとって役に立ちます。fisheriris にも GMM を実装しましたが、fitgmdist 関数がなかったので使用しませんでした。そこで、 http://chrisjmccormick.wordpress.com/2014/08/04/gaussian-mixture-models-tutorial-and-matlab-code/のコードを使用しました。

私がガウス混合モデルの理解の概念を読んだとき、アムロは結果をそのラベル、つまりsetosa、virginica、およびversicolorでプロットできました。彼はどうやってそれをしたのですか?何度か繰り返した後、mu、Sigma、および weight のみが得られました。ラベルは一切ありません。GMM イテレーションの混合モデルにラベル (setosa、virginica、versicolor) を付けたいと考えています。

4

1 に答える 1

0

そのプロットには 2 組の「ラベル」があります。

  • 1 つは Fisher Iris データセットの「真の」ラベルです (species各インスタンスのクラスを含む変数: setoasversicolor、またはvirginica)。通常、これらは実際のデータセットにはありません (クラスタリングの目的は、データ内のグループを発見することであり、事前にはわかりません)。ここでそれらを使用して、実際の真実に対して EM クラスタリングがどの程度うまく機能したかを把握しました (散布点はクラスに応じて色分けされています)。

  • もう 1 つのラベルのセットは、GMM を使用して見つけたクラスターです。基本的に、データ ドメイン全体をカバーする 2D ポイントの 50x50 グリッドを作成し、事後確率を計算して最も可能性の高いコンポーネントを選択することで、これらの各ポイントにクラスターを割り当てます。それらのクラスターを背景色で示しました。良い結果として、クラスター間の判別決定境界を確認できます。

左側のポイントのクラスターが非常にうまく分離されていることがわかります (そしてsetosaクラスと完全に一致しています)。プロットの右側の点は、他の 2 つのクラスに一致する 2 つに分離されましたが、「誤分類」されたインスタンスがありました (境界の反対側にある緑色の点)。

通常、実際の設定では、比較する実際のクラスがないため、クラスタリングがどれほど「正確」であったかを知る方法はありません (クラスタリングのパフォーマンス評価のための他のメトリックが存在します)...

于 2014-10-18T09:08:46.267 に答える