確率pで発生するイベントを記録するプログラムがあります。実行すると、k 個のイベントが記録されます。記録されているかどうかに関係なく、95% などのある程度の自信を持って、イベントの数を計算するにはどうすればよいでしょうか?
たとえば、13 個のイベントを記録した後、95% の信頼度で合計 13 ~ 19 個のイベントがあったと計算できるようにしたいと考えています。
確率pで発生するイベントを記録するプログラムがあります。実行すると、k 個のイベントが記録されます。記録されているかどうかに関係なく、95% などのある程度の自信を持って、イベントの数を計算するにはどうすればよいでしょうか?
たとえば、13 個のイベントを記録した後、95% の信頼度で合計 13 ~ 19 個のイベントがあったと計算できるようにしたいと考えています。
あなたのプロセスは二項プロセスと同じだと確信しています。記録されているイベントの確率pは成功と見なすことができます。根底にあるプロセスについてさらに詳しく説明する必要はないと思います。
問題のねじれは、nの値がわからず、kとpだけがわからないことです。信頼区間の計算では、通常、nとpがわかっていて、成功数であるk付近の信頼区間が必要であると想定しています。こちらをご覧ください。
kとpが与えられると、nの確率分布q(n)を決定し、既知のpとq(n)が与えられたkの分布を作成できるはずです。このkの分布は、信頼区間を生み出しますよね?
あなたの発言の問題は、あなたがその出来事の確率が分かっていると言っているということです。それがわかっていて、見たイベントの数がわかっていれば、イベントの数に誤りはありません。何回録音されたかわかりますか?
質問の仕方を再構成するか、別のことを見積もる必要があると思います。
それとも、実際のイベントが発生したときの 60% の時間だけ記録が行われると言っているのですか。何を測定しているのか、何がイベントを構成しているのか。類推は問題ありませんが、現在の定式化の方法では、イベントの真の数に関する信頼区間を構築する方法はありません。
これはアンドリュー・ウォーカーが統計サイトで出した答えです。これをこの質問に対する答えとして受け入れるつもりです。みんなありがとう。
p が 0 ~ 1 の場合:
(1/p) * k = 実際のイベントの典型的な数
random() が PERFECT である場合、それは常に true になります。ただし、通常はそうではありません。
大きな k の場合 (大きいほど、結果のベース ドン パーセンテージ オフの精度が高くなります)、実際の数値に近くなりますが、正確にヒットするかどうかは疑わしいです。