各 GMM コンポーネントの重みの決定方法
分類とクラスタリングのため のガウス混合モデル(GMM)について。各ガウス コンポーネントの重みは、コンポーネントの総数の平均として任意に設定されます。
これは、ほとんどの教科書、論文、および実用的な用途で常識として行われています。
- この問題に関する理論的な研究はありますか?
- それとも、本当に些細な問題ですか?
手がかりは大歓迎です
分類とクラスタリングのため のガウス混合モデル(GMM)について。各ガウス コンポーネントの重みは、コンポーネントの総数の平均として任意に設定されます。
これは、ほとんどの教科書、論文、および実用的な用途で常識として行われています。
手がかりは大歓迎です
賢明なことの 1 つは、混合の重みを事前確率に設定することですが、ほとんどの場合、混合の重みは隠れ変数であり、EM によって推定されることがわかりました。
必要な混合数に等しい k を使用して k-means クラスタリングを実行し、重みを比例して初期化できます。これは別の方法であり、ある程度理にかなっています。
一部のトレーニング データの混合メンバーシップがわかっている場合は、それを使用して事前確率を推定し、それを使用して混合の重みを初期化できますが、そのようなケースは見たことがありません。
余談ですが、混合物の数を設定する原則的な方法はありません。科学界は、そうではないことを確信していると思います。