私は 2 部またはハードル モデルを使用して、モデルの負の二項部分をモデル化するために共変量のセット (ハードル部分) と別の共変量のセットが与えられた場合の飛行確率をモデル化しています。
最初に、データ内のゼロの有無を説明するために最適な予測子を繰り返し検索しました。AIC 基準に基づいて、1 つの連続予測因子と 1 つの二分予測因子が選択されました。次に、連続予測子のセグメント化された用語の使用について調べました。連続共変量の 1 つのブレークポイントにより、適合が著しく改善されました。
セグメント化されたパッケージからの出力は次のとおりです
Estimated Break-Point(s):
Est. St.Err
3.849 1.368
t value for the gap-variable(s) V: 0
Meaningful coefficients of the linear terms:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -0.2744 0.3556 -0.772 0.4403
approach_km -0.4526 0.2184 -2.072 0.0383 *
sea2 0.3627 0.2280 1.591 0.1117
U1.approach_km 0.4549 0.2188 2.079 NA
U1.approach_km 係数の勾配は、その係数と approach_km 係数の差であり、本質的にゼロです。そのため、ブレークポイントを超える距離では、approach_km は存在または不在を予測しなくなります。
これらの変数をハードル モデルに追加するために、これらの変数をコーディングする方法を考え出しました。これは、基本的な glm 形式だけでなく、| で区切られた 2 つのセット (異なる可能性のある) coavriates を持つことが不可欠です。シンボル。
manual <- glm(occur ~ approach_km + I(pmax(approach_km-3.849,0)) + sea, data=land11, family=binomial)
summary(manual)
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -0.27441 0.29347 -0.935 0.350
approach_km -0.45261 0.09993 -4.529 5.92e-06 ***
I(pmax(approach_km - 3.849, 0)) 0.45486 0.10723 4.242 2.22e-05 ***
sea2 0.36271 0.22803 1.591 0.112
これにより、係数推定値は同じになりますが、Std は異なります。エラー。また、自由度は同じではありませんが (セグメント化されたオブジェクトの場合は 1 つ少なくなります)、同じ残留逸脱度 (両方とも 508.36) と同じ AIC スコア 516.36 になります。
Stdを取得する方法についての考え。エラーが一致するか、ハードルパッケージにこの式を入力するときに問題にならないか