39

これは非常に単純な質問ですが、理解できないようです。

glm 関数を使用してロジットを実行していますが、独立変数に関連する警告メッセージが引き続き表示されます。それらは因子として保存され、数値に変更しましたが、うまくいきませんでした。また、それらを 0/1 にコーディングしましたが、それも機能しませんでした。

助けてください!

> mod2 <- glm(winorlose1 ~ bid1, family="binomial")
Warning messages:
1: glm.fit: algorithm did not converge 
2: glm.fit: fitted probabilities numerically 0 or 1 occurred 

Zeligでも試しましたが、同様のエラー:

> mod2 = zelig(factor(winorlose1) ~ bid1, data=dat, model="logit")
How to cite this model in Zelig:
Kosuke Imai, Gary King, and Oliva Lau. 2008. "logit: Logistic Regression for Dichotomous Dependent Variables" in Kosuke Imai, Gary King, and Olivia Lau, "Zelig: Everyone's Statistical Software," http://gking.harvard.edu/zelig
Warning messages:
1: glm.fit: algorithm did not converge 
2: glm.fit: fitted probabilities numerically 0 or 1 occurred 

編集:

> str(dat)
'data.frame':   3493 obs. of  3 variables:
 $ winorlose1: int  2 2 2 2 2 2 2 2 2 2 ...
 $ bid1      : int  700 300 700 300 500 300 300 700 300 300 ...
 $ home      : int  1 0 1 0 0 0 0 1 0 0 ...
 - attr(*, "na.action")=Class 'omit'  Named int [1:63021] 3494 3495 3496 3497 3498 3499 3500 3501 3502 3503 ...
  .. ..- attr(*, "names")= chr [1:63021] "3494" "3495" "3496" "3497" ...
4

3 に答える 3

45

あなたが見た場合?glm(または2番目の警告メッセージをGoogleで検索した場合)、ドキュメントからこれに遭遇する可能性があります。

二項GLMの「数値的に0または1が発生した適合確率」に関する警告メッセージの背景については、Venables&Ripley(2002、pp。197–8)を参照してください。

今、誰もがその本を持っているわけではありません。しかし、これを行うのがコーシャであると仮定すると、関連する箇所は次のとおりです。

収束の問題とHauck-Donner現象の両方が発生する可能性があるかなり一般的な状況が1つあります。これは、近似確率が0または1に非常に近い場合です。数千のケースと約50のバイナリ説明変数(より少ないカテゴリ変数のコーディングから発生する可能性があります)を伴う医療診断の問題を考えてみます。これらの指標の1つが真になることはめったにありませんが、常に病気が存在することを示しています。その場合、その指標を持つケースの適合確率は1である必要があります。これは、βi =∞を取ることによってのみ達成できます。からの結果glm警告と約+/-10の推定係数になります。統計文献ではこれについてかなり広範囲に議論されており、通常、最尤推定値が存在しないと主張しています。Sautner and Duffy(1989、p.234)を参照してください。

この本の著者の一人は、ここでもう少し詳細にコメントしました。したがって、ここでのレッスンは、予測子のレベルの1つを注意深く調べることです。(そしてグーグルは警告メッセージです!)

于 2011-12-21T21:21:40.440 に答える