ロジスティック回帰の場合、pymc3 で glm を使用して正確に何が起こっているのかについての良い説明を見つけることができませんでした。そこで、GLM バージョンを明示的な pymc3 モデルと比較しました。ドキュメント用の ipython ノートブックの作成を開始しました。以下を参照してください。
http://christianherta.de/lehre/dataScience/machineLearning/mcmc/logisticRegressionPymc3.slides.php
私が理解していないのは:
GLM のパラメータに使用される前もって何ですか? それらも正規分布していると思います。GLM でのビルドと比較して、明示的なモデルでは異なる結果が得られました。(上記のリンクを参照)
データが少ないと、サンプリングが動かなくなったり、非常に悪い結果しか得られませんでした。より多くのトレーニングデータを使用すると、この動作を観察できませんでした。これはmcmcにとって正常ですか?
ノートブックにはさらに問題があります。
ご回答有難うございます。