4

合計チケット数と累積チケット販売データが次のように表示される状況があります。

Total Tickets Available: 300
Day 1: 15 tickets sold to date
Day 2: 20 tickets sold to date
Day 3: 25 tickets sold to date
Day 4: 30 tickets sold to date
Day 5: 46 tickets sold to date

販売されたチケットの数は非線形であり、誰かが23日目にチケットを購入する予定があるかどうか尋ねられますが、彼がチケットを取得する確率はどれくらいですか?

numpy、PyLab、sageなどのカーブフィッティングに使用されるライブラリをかなり見てきましたが、統計が私のバックグラウンドにないため、少し圧倒されました。このデータセットが与えられた場合、どのようにして確率を簡単に計算できますか?それが役に立ったら、他の場所でのチケット販売データもあります。曲線は多少異なるはずです。

4

1 に答える 1

2

この質問への最良の答えは、問題に関するより多くの情報を必要とするでしょう.日付が近づくにつれて、人々はチケットを購入する可能性が高くなりますか/低くなりますか? 販売率に一時的に影響する広告イベントはありますか? 等々。

ただし、その情報にアクセスすることはできないため、最初の概算として、チケットの販売率は一定であると仮定しましょう。販売は基本的にランダムに発生するため、ポアソン過程としてモデル化するのが最適かもしれません。これは、多くの人が複数のチケットを購入するという事実を説明していないことに注意してください。ただし、結果に大きな違いはないと思います。おそらく、本物の統計学者がここで声を上げることができます. また、ここでは定率ポアソン過程について説明しますが、率は明らかに一定ではないと述べたので、次のステップとして可変率ポアソン過程を調べることができることに注意してください。

ポアソン過程をモデル化するために必要なのは、チケット販売の平均レートだけです。サンプル データでは、1 日あたりの売上は [15, 5, 5, 5, 16] であるため、平均レートは 1 日あたり約 9.2 チケットです。すでに46枚売れたので残り254枚です。

ここから、「レートが 9.2 tpd であるとすると、23 日間で 254 枚未満のチケットが販売される確率はどれくらいですか?」という質問は簡単です。( 300 枚以上のチケットを販売できないという事実は無視してください)。これを計算する方法は、累積分布関数を使用することです (ポアソン分布の CDF については、こちらを参照してください)。

平均して、23 日後に 23 * 9.2 = 211.6 のチケットが販売されると予想されるため、確率分布の言語では、期待値は 211.6 です。CDF は、「期待値 λ が与えられた場合、値 <= x となる確率はいくらか」を教えてくれます。自分で計算することも、scipy に計算を依頼することもできます。

>>> import scipy.stats
>>> scipy.stats.poisson(9.2 * 23).cdf(254-1)
0.99747286634158705

したがって、これは、チケット販売がポアソン過程として正確に表現でき、チケット販売の平均レートが実際に 9.2 tpdである場合、さらに 23 日後に少なくとも 1 枚のチケットが利用可能になる確率は 99.7% であることを示しています。

ここで、誰かが 50 人の友人のグループを連れてきて、25 日間でチケットを購入した場合に 50 枚のチケットをすべて手に入れる確率を知りたいとします (質問を次のように言い換えてください。 <= (254-50) チケットを販売する確率?"):

>>> scipy.stats.poisson(9.2 * 25).cdf(254-50)
0.044301801145630537

したがって、25 日後に 50 枚のチケットが利用可能になる確率は約 4% です。

于 2012-07-14T15:57:18.300 に答える