2

私はRを初めて使用します。ターゲットと一緒にサンプルのセットを持っているので、新しいサンプルのターゲットを解決するために数値関数を当てはめたいと思います。私のサンプルは、ユーザーがこの場所に滞在している時間を秒単位で示しています。

>b <- c(101,25711,13451,19442,26,3083,133,184,4403,9713,6918,10056,12201,10624,14984,5241,
+21619,44285,3262,2115,1822,11291,3243,12989,3607,12882,4462,11553,7596,2926,12955,
+1832,3539,6897,13571,16668,813,1824,10304,2508,1493,4407,7820,507,15866,7442,7738,
+5705,2869,10137,11276,12884,11298,...)

まず、それらを3600で割った時間に変換し、期間のpdfとして関数を適合させたい:

> b <- b/3600
> hist(c,xlim=c(0,13),prob=T,breaks=seq(0,24,by=0.5))
> lines(density(x), col=red)

ここに画像の説明を入力

図の赤い線に合わせて、新しい値を補間して、この場所の特定の期間の確率を見つけたいと思います。たとえば、p(duration = 1.5hours) です。

ご清聴ありがとうございました!

4

1 に答える 1

2

fitdistr上で提案したように、ディストリビューションをMASSパッケージ内に収めることができます。連続分布を使用すると、時間が間隔内にある確率が得られます。離散分布を使用すると、特定の時間 (時間単位) の確率を計算できます。

連続の場合、ガンマ分布を使用できfitdistr(b, "Gamma")ます。パラメータの推定値が得られpgamma、それらの推定値と間隔を使用できます。

離散ケースでは、ポアソン分布を使用できます。fitdistr(b, "Poisson")次にdpois、推定値と必要な値を含む関数を使用できます。

どちらを使用するかを決定するには、pdf をヒストグラムでプロットして見てみます。

于 2013-03-23T20:50:15.930 に答える