私の予測子には 2 つのレベルがあります。
>table(predictor)
predictor
1 2
12115 4257
私の応答には2つのレベルもあります:
> table(response)
response
1 0
12115 4257
したがって、明らかに、ここには完全に線形の相関関係があります。しかし、後でロジスティック回帰と予測を実行すると、次のようになります。
logit = glm(response~predictor, data=data, family="binomial")
pred = predict(logit, newdata=data, type="response")
ただし、予測では、実際のデータとは正反対の結果が得られます。
pred 1 0
2.90070146547072e-12 12115 0
0.999999999997099 0 4257
ここで何がうまくいかなかったのか誰にもわかりますか?これはどのように説明できますか?
ありがとうございました!