parsnip
ログオフセットを使用して xgboost ポアソン回帰モデルに適合するレシピを指定するために使用しようとしています。ポアソン回帰を設定するには、 でオプションを指定できますset_engine
。これはうまく機能します。
# Specify recipe
my_recipe <- recipe(training_df, Count ~.) %>%
# Remove covariates that are 80% correlated
step_corr(all_predictors(), threshold = 0.8) %>%
step_center(all_predictors(), -all_outcomes()) %>%
step_scale(all_predictors(), -all_outcomes())))
# Specify xgboost config
tune_spec <- boost_tree(
trees = 100) %>%
set_engine("xgboost", objective='count:poisson') %>%
set_mode("regression") %>%
translate()
xgboost のドキュメントとこの例を見ると、オフセットを指定するには次のアプローチが推奨されるようです。
setinfo(xgtrain, "base_margin", log(training_df$my_offset))
set_engine
これを上記に含める方法がわかりません。具体的にはxgtrain
、 dataframeに関連付ける方法がわかりませんtraining_df
。