2

観測値 (x, y) を含むテーブルがあり、それらにさらに類似するポアソン分布の平均を推定する必要があります。RとOctaveの両方がLinuxでこれを行うことができるようですが、マルチプラットフォームでそれを行う方法があるかどうか疑問に思っていました. プログラムに何でもバンドルできますが、プログラムを実行するために何かをインストールするように要求することはできません。

自分でできるアルゴリズムを探してみたのですが見つからず、どうすればいいのかわかりません。

記録のために、基本的にすべての値を合計し、例の数で割る単純なアルゴリズムを見つけましたが、本から直接取った些細な例でさえ失敗します。

例:

requisitions per day : absolute frequency (days) : relative frequency
 8 :  2 : 0.016
 9 :  4 : 0.033
10 :  6 : 0.050
11 :  8 : 0.066
12 : 10 : 0.083
13 : 12 : 0.100
14 : 13 : 0.108
15 : 14 : 0.116
16 : 12 : 0.100
17 : 10 : 0.083
18 :  9 : 0.075
19 :  7 : 0.058
20 :  5 : 0.041
21 :  3 : 0.025
22 :  2 : 0.016
23 :  2 : 0.016
24 :  1 : 0.008

ポアソン分布の平均は 15 である必要があります (例を入手した本によると)。上で述べた答えの 1 つにある方法では、16 が得られます。2 乗ユークリッド距離の合計を使用すると、平均 15 のポアソンは平均 16 のポアソンよりもデータに近いことがわかります。

4

1 に答える 1

4

平均の MLE は、サンプル平均です。ウィキペディアを参照してください。

http://en.wikipedia.org/wiki/Poisson_distribution#Maximum_likelihood

データのベクトルを平均するだけです。

更新:質問に追加されたばかりのサンプルデータに基づいて、この回答を拡張しています。

サンプルデータの私の解釈は、

reqs-per-day   frequency
 8             2
 9             4
10             6

は、各日の要求数が 8 である日が 2 日あったことを意味します。また、要求数が 9 である日が 4 日あったことを意味します。したがって、データは次のように等しいと仮定します。

8,8,9,9,9,9,10,10,10,10,10,10,...

ここで、このリストの各エントリは 1 日に対応します。このリストの順序は重要ではありません。このリストを平均化する必要があると思います。

あなたの度数フィールドの合計は 120 です。これは、実験全体で 120 日あったことを意味します。

于 2011-05-17T00:52:30.013 に答える