4

私はこのデータセットを持っています:

年齢 -- 仕事 ------- ローン -- Y
57 -- 退職 -- - はい -- いいえ
44 -- 管理者 - - -- いいえ -- いいえ
39 -- 不明 -- いいえ -- いいえ
47 - - サービス -- いいえ -- はい
41 -- 管理者 ----- いいえ -- NA
51 -- 教師 --- はい -- いいえ
45 -- 不明 -- いいえ -- はい
57 -- 退職 ---- -- いいえ -- いいえ
42 -- 教師 ----- いいえ --NA
30 -- 生徒 ----- いいえ -- NA

ロジスティック回帰を使用して y のすべての値を予測したいのですが、10 個の予測のうち 7 個しか得られません。したがって、 の場合は省略しy==NAます。

これが私のコードです:

 fit <- glm(y~ age+ as.factor(job)+ as.factor(loan), data= mydat, family=binomial)     
 predict( fit, type="response", na.action=na.pass)        

y欠損値がある場合でも応答値を予測するにはどうすればよいですか?

4

3 に答える 3

1

何かのデータがない場合、それをモデル化することはできず、結果として予測することはできません。たとえば、ローンのない学生のデータはありません。では、ローンのない学生の y をどのように予測することをお勧めしますか? それには魔法が必要です。

一方、モデルからジョブを省略したり、なんらかの方法でコードを書き直したりすると (例: 初心者/経験者/不明)、すべてのケースを予測できる可能性があります。もちろん、最善のアドバイスは、より多くのデータを取得することです。

于 2013-07-26T07:26:39.410 に答える
0

データから「学生」を削除し、予測で newdata 引数を使用します。

predict(fit,newdata=mydat,type="response")
于 2013-11-19T15:50:53.093 に答える