私はExcelに大きなデータセットを持っています。数値が Javaのポアソン分布または二項分布に従うかどうかを調べたい。これを行うのに役立つオープンソース ライブラリはありますか。私はApache Common Mathを見ています。
ポインタは役に立ちますか?
(比較的単純な) モデル フィッティングの問題があり、2 つの分布から選択しようとしているようです。通常、これを行う方法は次のとおりです。
p_poisson
データのポアソン分布のパラメーターを推定するp_binomial
データの二項分布のパラメーターを推定します。p(data | p_poisson)
およびp(data | p_binomial)
(尤度関数) を計算し、より高い確率を持つものを選択します。より一般的には、AIC、BIC 、およびモデル選択に関する一般情報を参照することをお勧めします。この場合、大量のデータがない場合、二項分布は、ポアソンよりも多くのパラメーターを持っているため、過剰適合の可能性についてわずかにペナルティを課す必要があります。