0

ロジスティック回帰によって推定された係数の不確実性を定量化するために、ジャックナイフ分析を適用することに興味があります。独立変数が 0 - 1 形式であるため、glm(family='binomial') を使用しています。

私のデータセットには 76000 個の観測点があり、7 つの独立変数とオフセットを使用しています。このアイデアには、データをたとえば 5 つのランダムなサブセットに分割し、データセットから一度に 1 つのサブセットを削除して 7 つの推定パラメーターを取得することが含まれます。次に、パラメーターの不確実性を推定できます。

手順は理解できますが、R では実行できません。

これは私がフィッティングしているモデルです:

glm(f_ocur ~ altitud + UTM_X + UTM_Y + j_sin + j_cos + temp_res + pp +
             offset(log(1/off)), data = mydata, family = 'binomial')

これを可能にする方法を知っている人はいますか?

4

1 に答える 1

1

ロジスティック回帰モデルのジャックナイフ現象は、非常に非効率的です。しかし、時間のかかる簡単なアプローチは次のようになります。

Formula <- f_ocur~altitud+UTM_X+UTM_Y+j_sin+j_cos+temp_res+pp+offset(log(1/off))
coefs <- sapply(1:nrow(mydata), function(i)
  coef(glm(Formula, data=mydata[-i, ], family='binomial'))
)

これは、リーブワンアウト係数の推定値の行列です。この行列の共分散行列は、パラメーター推定値の共分散行列を推定します。

glmの主力関数を使用することで、大幅な時間の改善が得られる可能性がありglm.fitます。モデルを線形化することで、さらに先に進むことができます(1ステップ推定を使用niterし、ニュートンラフソンアルゴリズムで1回の反復のみに制限し、1ステップ推定にJackknife SEを使用すると、堅牢で偏りがなく、ビット全体が...)

于 2012-11-14T17:20:03.433 に答える