ブラックボックスの乱数ジェネレーターが一定の間隔で整数値を継続的に放出するとします (直接の関心の場合、[0, 255])。確率質量関数とその変動の尺度を推定したいのですが、これまでのサンプル セット全体を保存することなく、新しいサンプルが入ってくるたびにこれらの推定値を定期的に更新したいと考えています。
- これらの推定値を計算および更新するための数値的に安定したアルゴリズムを提案してください。
- PMF の変動の適切な尺度を提案してください。
ブラックボックスの乱数ジェネレーターが一定の間隔で整数値を継続的に放出するとします (直接の関心の場合、[0, 255])。確率質量関数とその変動の尺度を推定したいのですが、これまでのサンプル セット全体を保存することなく、新しいサンプルが入ってくるたびにこれらの推定値を定期的に更新したいと考えています。
離散分布の pmf は、各結果の相対的な割合です。すべてゼロに初期化された長さ 256 の配列を作成します。値ごとに、そのインデックスで配列をインクリメントします。結果を相対比率 (推定確率) として表すために、観測の総数でスケーリングします。出来上がり、インスタント経験的 pmf であり、数百万または数十億の観測がある場合でも、256 の値しか保存していません。結果が小さなサブセットに限定されている場合は、配列ではなくハッシュを使用してください。
値と関連するカウントが与えられれば、中心傾向または変動に対して任意のメジャーを作成できます。変動については、範囲、四分位範囲、または分散および/または標準偏差を考慮することができます。