1

私は R の初心者です。 glm を使用してロジスティック回帰を実行し、「margins」パッケージを使用して限界効果を計算していますが、カテゴリ独立変数の欠損値を除外できないようです。

回帰から NA を除外するように R に依頼しようとしました。カテゴリ変数は 9 歳の体重の状態 (wgt9) で、3 つのレベル (1、2、3) といくつかの NA があります。

私は何を間違っていますか?出力に wgt9NA の結果が表示されるのはなぜですか?どうすれば修正できますか?

ヘルプ/アドバイスをお寄せいただきありがとうございます。

ロジスティック回帰を実施する

summary(logit.phbehav <- glm(obese13 ~ gender + as.factor(wgt9) + aded08b, 
data = gui, weights = bdwg01, family = binomial(link = "logit")))

回帰出力

term              estimate std.error statistic   p.value
  <chr>                <dbl>     <dbl>     <dbl>     <dbl>
1 (Intercept)        -3.99      0.293     -13.6  2.86e- 42
2 gender              0.387     0.121       3.19 1.42e-  3
3 as.factor(wgt9)2    2.49      0.177      14.1  3.28e- 45
4 as.factor(wgt9)3    4.65      0.182      25.6  4.81e-144
5 as.factor(wgt9)NA   2.60      0.234      11.1  9.94e- 29
6 aded08b            -0.0755    0.0224     -3.37 7.47e-  4

限界効果を計算する

effects_logit_phtotal = margins(logit.phtot) 
print(effects_logit_phtotal)
summary(effects_logit_phtotal)

限界効果出力

> summary(effects_logit_phtotal)
factor     AME     SE       z      p   lower   upper
aded08a -0.0012 0.0002 -4.8785 0.0000 -0.0017 -0.0007
gender  0.0115 0.0048  2.3899 0.0169  0.0021  0.0210
wgt92  0.0941 0.0086 10.9618 0.0000  0.0773  0.1109
wgt93  0.4708 0.0255 18.4569 0.0000  0.4208  0.5207
wgt9NA  0.1027 0.0179  5.7531 0.0000  0.0677  0.1377
4

1 に答える 1