R のほとんどすべての機械学習パッケージ/関数を使用すると、モデルのトレーニング中に相互検証パフォーマンス メトリックを取得できます。
私が知る限り、xgboost で相互検証を行う唯一の方法は、次のxgb.cv
ようなステートメントを設定することです。
clf <- xgb.cv( params = param,
data = dtrain,
nrounds = 1000,
verbose = 1,
watchlist = watchlist,
maximize = FALSE,
nfold = 2,
nthread = 2,
prediction = T
)
ただし、そのオプションを使用してもprediction = T
、トレーニング データから予測結果を取得しているだけです。clf
結果のオブジェクト (この例では)predict
を新しいデータを含むステートメントで使用する方法がわかりません。
私の理解は正確ですか?回避策はありますか?