問題タブ [mclust]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - RのMclustとsklearnのGaussian Mixtureの違い
データセット内のクラスターを見つけるためにガウス混合モデリングを実行していました。最初に sklearn の Gaussian Mixture クラスを使用し、BIC によると 3 つのクラスターが最適な数であることがわかりました。
次に、次のようにRでこれを再確認したかった:
ただし、R では、mclust は VEE モデルで 13 個のクラスターを言いました。違いはどこで生じたのですか?この回答min_covar=0.0000001
に記載されているようにGMM を設定しようとしましたが、そのドキュメントはサポートされなくなりました。私の考えでは、それはいくつかの小さなスケーリングの違いまたは. sklearn でチューニングすることをお勧めしますか? mclustの VVV モデルに似ていますか?covariance_type
convariance_type
covariance_type='full'
r - BIC の再現性は、R の mclust パッケージを介した潜在クラス分析で得られます
mclust パッケージを使用して、R で潜在クラス分析を行っています。最適なモデルまたは最適なクラス数を選択するために BIC にコードを提供しましたが、同じコードを再実行するたびに一貫性のない出力が得られるため、ソリューションが再現できないことに気付きました。たとえば、以下に示すように、最初にコードを実行すると、最適なモデルとして 7 つのクラスを持つ VVV モデルが生成されます。その他の最適適合モデルの候補には、VVV,6 および EVE, 8 が含まれます (以下を参照)。
同じコードをもう一度実行してみましたが、以下に報告されているように、EVE,9、EVE,8、および EVI,9 など、さまざまな最適なモデルが提案されます。
私の質問は、この問題を解決して結果の再現性を可能にする方法についてです。これについて何か助けていただければ幸いです。