問題タブ [mixture-model]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
5200 参照

python - scikit-learn GMM は正の対数確率を生成します

私はpython scikit-learnパッケージのガウス混合モデルを使用してデータセットをトレーニングしていますが、コーディング時にそれを見つけました

-- G=mixture.GMM(...)

-- G.フィット(...)

-- G.score(合計機能)

結果の対数確率は正の実数です...なぜですか? 対数確率は負であることが保証されていませんか?

わかった。ガウス混合モデルが返すものは、確率「質量」ではなく対数確率「密度」であるため、正の値は完全に合理的です。

共分散行列が特異値に近い場合、GMM はうまく機能しません。一般に、データがそのような生成タスクに適していないことを意味します。

0 投票する
0 に答える
1309 参照

c++ - Opencv:ガウス混合モデル(GMM)を使用して期待値最大化(EM)を取得

私はGMMを使用して、ビデオフレーム内のさまざまな色の期待値の最大化を見つけようとしています。それに従って、どちらがドミナントカラーかを判断します。

そのため、私の問題は、GMMベースのEMを実行して、さまざまな色の期待値を取得して比較するにはどうすればよいかということです。

0 投票する
1 に答える
472 参照

matlab - オブジェクト検出のためのリアルタイムでのガウス混合モデルの実装

私はリアルタイムのビデオ圧縮に取り組んでいます。私はMATLABでそれをモデル化しています。後で5832MIPS、729MHzのDSPプロセッサに実装する必要があります。

DSPプロセッサにガウス混合モデルを実装することは可能ですか、それともオブジェクト検出のためのより良いアルゴリズムがありますか?

前もって感謝します

0 投票する
3 に答える
183 参照

machine-learning - 住宅エリアでの ML / 密度クラスタリング。各次元の 2 成分以上の混合物

ML を自己学習しようとして、この問題に遭遇しました。この分野の経験豊富な人々からの助けをいただければ幸いです。

バスルーム、リビングルーム、キッチンなどの家のコンパートメントの領域を持つ 3 つのベクトルがあるとします。データは約7万戸。個々のベクトルのヒストグラムには、二峰性分布、たとえば 2 成分ガウス混合の証拠が明らかにあります。これらの属性に従って家屋を分類する、できれば教師なしの、ある種の ML アルゴリズムが必要になりました。例: 大きなバスルーム、小さなキッチン、大きなリビング ルーム。

より具体的には、アルゴリズムが各バイモーダル分布ベクトルに対して可能な限り最良の分離しきい値を選択することを望みます。たとえば、大小のキッチン(バイモダリティの証拠を想定しているため、これはバイナリである可能性があります)、他のものについても同じことを行い、データをクラスター化します. 理想的には、中間体制の家をチェックできるように、これにはある程度の信頼度が伴います...たとえば、明らかに大きなキッチンがある家ですが、そのバスルームはしきい値エリア/大/小バスルームの境界に近くなりますたとえば、「大きなキッチンと大きなバスルーム」のリストの一番下に置くことができます。このため、最初にしきい値を決定し (FDR の可能性が低いガウス分布を当てはめる)、データを折りたたんでからクラスタリングすることは望ましくありません。

進め方について何かアドバイスはありますか?私はRとpythonを知っています。

どうもありがとう!!

0 投票する
1 に答える
4411 参照

r - ガウス分布とガンマ分布の混合

ガウス分布とガンマ分布の混合物からコンポーネント分布パラメーターを見つけるために、R でいくつかのスクリプト/パッケージを探しています (Python もそうします)。これまで、R パッケージの "mixtools" を使用してデータをガウスの混合物としてモデル化してきましたが、ガンマとガウスを組み合わせることでより適切にモデル化できると思います。

ありがとう

0 投票する
1 に答える
478 参照

r - 二変量混合正規対数正規モデルのパラメータ推定

正規分布と対数正規分布が混在するモデルを作成する必要があります。これを作成するには、対数尤度関数を最大化して、2 つの共分散行列と混合パラメーター (合計 =7 パラメーター) を推定する必要があります。この最大化は nlm ルーチンで実行する必要があります。

相対データを使用しているため、平均は既知であり、1 に等しくなります。

私はすでに1次元(相対データの1セット)でそれをやろうとしましたが、うまくいきます。ただし、相対データの 2 番目のセットを導入すると、相関関係について非論理的な結果が得られ、多くの警告メッセージ (合計 25) が表示されます。

これらのパラメーターを推定するために、最初に 2 つのコマンド dmvnorm と dlnorm.plus を使用して対数尤度関数を定義しました。次に、パラメーターの開始値を割り当て、最後に nlm ルーチンを使用してパラメーターを推定します (以下のスクリプトを参照)。

誰かが私のモデルの何が問題なのか、またはこれらのパラメーターを 2 次元で見つけるにはどうすればよいかを知っていますか?

私の質問に時間を割いていただき、誠にありがとうございます。

よろしく、

グラディス・ハーツォグ

0 投票する
1 に答える
1070 参照

matlab - ガウス混合モデル確率matlab

寸法が 50x100000 のデータがあります。(100000 個のフィーチャ、それぞれのディメンションは 50 です)。

このデータを使用してガウス混合モデルを当てはめたいと思います。次のコードを使用しました。

私が必要とするのは、新しいデータを与えるときに、YI が尤度確率 $p(Y|\theta)$ を取得できるようにすることです。ここで、$\theta$ はガウス混合モデルのパラメーターです。

次のコードを使用して確率値を取得しました。

しかし、私は非常に低い値を取得していますが、すべて約 0 です。適切な確率値を取得するにはどうすればよいですか?

0 投票する
1 に答える
2238 参照

pymc - PyMCで3つの法線の混合物をモデル化するには?

PyMC を使用して 2 つの正規分布をデータに適合させる方法について、CrossValidated に関する質問があります。Cam.Davidson.Pilonの答えは、ベルヌーイ分布を使用して、2 つの法線のいずれかにデータを割り当てることでした。

今私の質問は: 3 つの法線でそれを行う方法は?

基本的に、問題はベルヌーイ分布と 1-ベルヌーイを使用できなくなったことです。しかし、それを行う方法は?


編集: CDP の提案により、次のコードを書きました。

次のサンプリング手順によるトレースも良好に見えます。解決しました!

0 投票する
2 に答える
1381 参照

mcmc - PyMC を使用した 3 つの法線のフィッティング: 単純なデータでの不適切な収束

(この質問のものと同様) を使用して、3 つの法線をデータに適合させるための PyMC モデルを作成しました。

データをサンプリングした分布は明らかに重複していますが、3 つの明確なピークがあります (下の画像を参照)。この種のデータに 3 つの法線を当てはめるのは簡単で、MCMC 実行の 99% で (-10, 0, 10) からサンプリングした平均値が得られると期待しています。 3 つの正規分布からのデータ 私が期待する結果の例。これは 10 件中 2 件で発生しました。 ぴったりフィットする MCMC トレース 10 件中 6 件で発生した予期しない結果の例。これは奇妙です。なぜなら、-5 ではデータにピークがないため、サンプリングが行き詰まる可能性のある深刻な極小値 ((-5,-5) から (-6,-4) への移行) を実際に求めることができないからです。フィット感を改善する必要があります)。 不適切な適合を生成する MCMC トレース

ほとんどの場合、(アダプティブ メトロポリス) MCMC サンプリングが停止する理由は何ですか? サンプリング手順を改善するために可能な方法は何ですか?

したがって、実行は収束しますが、実際には適切な範囲を探索しません。


更新: 異なる事前確率を使用して、5/10 で正しい収束 (約 1 番目の画像) を取得し、他の 5/10 で間違った収束 (約 2 番目の画像) を取得します。基本的に、変更された行は以下の行で、AdaptiveMetropolis ステップ メソッドが削除されています。

0 投票する
2 に答える
1213 参照

scikit-learn - scikit-learn で GMM を 3D ヒストグラムに適合させる

scikit-learn の混合モデル コードは個々のデータ ポイントのリストに対して機能しますが、ヒストグラムがある場合はどうでしょうか。つまり、ボクセルごとに密度値があり、混合モデルでそれを近似する必要があります。これは可能ですか?1 つの解決策は、このヒストグラムから値をサンプリングすることだと思いますが、それは必要ではありません。