を使用してロジスティック回帰を近似しようとしていglm( family='binomial')
ます。
モデルは次のとおりです。
model<-glm(f_ocur~altitud+UTM_X+UTM_Y+j_sin+j_cos+temp_res+pp,
offset=(log(1/off)), data=mydata, family='binomial')
mydata
76820の観測値があります。応答変数(f_ocur)は0-1です。
このデータはより大きなデータセットのサンプルであるため、オフセットを設定するという考え方は、ここで使用されるデータが分析対象の実際のデータのサンプルを表すことを考慮に入れることです。
何らかの理由でオフセットが機能していません。このモデルを実行すると結果が得られますが、同じモデルを実行してもオフセットがない場合は、前のモデルとまったく同じ結果が得られます。私は別の結果を期待していましたが、違いはありません。
私は何か間違ったことをしていますか?オフセットは線形予測子を使用する必要がありますか?このような:
model <- glm(f_ocur~altitud+UTM_X+UTM_Y+j_sin+j_cos+temp_res+pp+offset(log(1/off)),
data=mydata, family='binomial')
モデルの準備ができたら、新しいデータで使用したいと思います。新しいデータは、このモデルを検証するためのデータになります。このデータには同じ列があります。私の考えは使用することです:
validate <- predict(model, newdata=data2, type='response')
そして、ここに私の質問があります、予測関数はモデルを作成するために使用されるオフセットを考慮に入れていますか?そうでない場合、新しいデータの正しい確率を取得するにはどうすればよいですか?