1

過去の発生リストに基づいてパーセンテージ確率を計算したいと考えています。
データはこの簡略化された表に似ています。たとえば、過去に最初の値が 8 だった場合、イベントが発生する可能性は 72% でした。

1   76%
2   64%
4   80%
6   85%
7   83%
8   72%
11  70%

完全なテーブルの範囲は 0 ~ 1030 で、377 行ありますが、毎日変更されます。関数に 3 などの値を渡し、イベントが発生する確率をパーセンテージで返したいと考えています。正確なコードは必要ありませんが、正しい方向を示していただければ幸いです。ありがとう

4

1 に答える 1

0

質問のコメントでの回答に基づいて、補間をお勧めします---線形補間が最も簡単な答えです。スプレッドシートの系列に基づいて、確率モデルが適切であるようには見えません (列 1 と列 3 の間に明確な関係はないようです)。

これがどのように機能するかの例を挙げると、データで観測されていないある点 p の確率が必要だと想像してください。p未満の最大値は p_low (対応する確率 f(p_low)) であり、p より大きい最小値は p_high (確率 f(p_high)) です。p の推定値は次のとおりです。

interval = p_high - p_low
f_p_hat = ((p-p_low)/interval*f_p_low) + ((p_high-p)/interval*f_p_high)

これにより、p_low と p_high の値の加重平均を見積もることができます。重みは、p と p_low、および p と p_high の間の距離によって与えられます。たとえば、p が p_low と p_high の間で等距離にある場合、f_p_hat (f(p) の推定値) は p_low と p_high の平均にすぎません。

現在、エンドポイントでの推定値が不正確であると疑われる理由がある場合 (おそらくサンプル サイズが小さいため)、線形補間は機能しない可能性があります。もしそうなら、pの周りの点の近傍に(おそらく重み付けされた)最小二乗法を当てはめ、それを予測として使用することが可能です。この場合、もう少し詳しく説明できます。

于 2012-11-21T16:15:11.013 に答える