5

R で請求頻度 (ポアソン分布) をモデル化しています。gbmxgboostパッケージを使用しxgboostていますが、エクスポージャーを考慮に入れるためのオフセット パラメーターがないようです。

では、gbm次のように露出を考慮します。

gbm.fit(x = train,y = target, n.trees = 100,distribution = "poisson", offset = log(exposure))

`xgboostで同じことを達成するにはどうすればよいですか?

PS: クレームが観察されるたびに新しい観測点が作成されるため、露出を予測因子として使用することはできません。

4

2 に答える 2

4

xgboost マトリックスを作成したら、setinfo と base_margin 属性を使用してオフセットを設定できます。

setinfo(xgtrain, "base_margin", log(d$exposure))

私がここで尋ねた同様の質問から完全な例を見ることができます: XGBoost - 露出/オフセットが変化するポアソン分布

于 2016-09-13T14:59:19.987 に答える