0

7 日間の広告期間が 5 日間の広告期間よりも優れているかどうかをテストしようとしているデータ セットがあります。これをテストするには、ロジスティック回帰が最適な方法だと思います。テストをそれぞれ 2 週間実行しました。トラフィック、サインアップ、減少などのデータがあります。

データは次のようになります。

              5d         7d  greater (does the 7d have atleast 5% more than 5d)
Traffic     179650  196395   1
subscribers 437899  442068   0
attrition   2304    2376     0
signups     5039    6246     1

1 ははい、0 はいいえを意味します。

Rでこのコードを実行しました:

fit2<-glm(greater~X5d + X7d, data=logr2, family = "binomial")

それから

predict(fit2, data=logr2, type = "response")

私の出力は次のとおりです。

 1            2            3            4 
1.000000e+00 6.753019e-13 1.386707e-10 1.000000e+00 

また

> round(predict(fit2, data=logr2, type = "response"))
1 2 3 4 
1 0 0 1 

1 または 0 を伝えるために 1 つの出力のみを取得するように実行するにはどうすればよいですか (IE では、7 日間で全体の増加率が 5% を超えていますか?)

ありがとう

4

1 に答える 1

0

predict関数の引数名を混同したと思います(ドキュメントを参照)。これを試してください:

predict(fit2, newdata=logr2, type = "response")

奇妙な出力は、予測するための入力としてトレーニング データを与えているという事実から来ていますが、これはあまり意味がありません。次のように、いくつかの新しいデータ ポイントを試してください。

input = data.frame(X5d = 123, X7d = 22)
predict(fit2, newdata=logr2, type = "response")

結果:

1

2.775557e-13

つまり1、確率でほぼ0.

データセットから正確なポイントを与える場合:

input = data.frame(X5d = 179650, X7d = 196395)
predict(fit2, newdata=input, type = "response")

結果:

1

1

だからそれ1は確率で1

トレーニング セットから他のデータ ポイントを確認できます。このような少数のトレーニング データ サンプルでは、​​適合が理想的であるため、結果は完璧です。

簡単な同様の例をここで見つけることができます。

于 2013-11-06T23:58:06.027 に答える