私は R の初心者です。 glm を使用してロジスティック回帰を実行し、「margins」パッケージを使用して限界効果を計算していますが、カテゴリ独立変数の欠損値を除外できないようです。
回帰から NA を除外するように R に依頼しようとしました。カテゴリ変数は 9 歳の体重の状態 (wgt9) で、3 つのレベル (1、2、3) といくつかの NA があります。
私は何を間違っていますか?出力に wgt9NA の結果が表示されるのはなぜですか?どうすれば修正できますか?
ヘルプ/アドバイスをお寄せいただきありがとうございます。
ロジスティック回帰を実施する
summary(logit.phbehav <- glm(obese13 ~ gender + as.factor(wgt9) + aded08b,
data = gui, weights = bdwg01, family = binomial(link = "logit")))
回帰出力
term estimate std.error statistic p.value
<chr> <dbl> <dbl> <dbl> <dbl>
1 (Intercept) -3.99 0.293 -13.6 2.86e- 42
2 gender 0.387 0.121 3.19 1.42e- 3
3 as.factor(wgt9)2 2.49 0.177 14.1 3.28e- 45
4 as.factor(wgt9)3 4.65 0.182 25.6 4.81e-144
5 as.factor(wgt9)NA 2.60 0.234 11.1 9.94e- 29
6 aded08b -0.0755 0.0224 -3.37 7.47e- 4
限界効果を計算する
effects_logit_phtotal = margins(logit.phtot)
print(effects_logit_phtotal)
summary(effects_logit_phtotal)
限界効果出力
> summary(effects_logit_phtotal)
factor AME SE z p lower upper
aded08a -0.0012 0.0002 -4.8785 0.0000 -0.0017 -0.0007
gender 0.0115 0.0048 2.3899 0.0169 0.0021 0.0210
wgt92 0.0941 0.0086 10.9618 0.0000 0.0773 0.1109
wgt93 0.4708 0.0255 18.4569 0.0000 0.4208 0.5207
wgt9NA 0.1027 0.0179 5.7531 0.0000 0.0677 0.1377