1

R のほとんどすべての機械学習パッケージ/関数を使用すると、モデルのトレーニング中に相互検証パフォーマンス メトリックを取得できます。

私が知る限り、xgboost で相互検証を行う唯一の方法は、次のxgb.cvようなステートメントを設定することです。

clf <- xgb.cv(      params              = param, 
                    data                = dtrain, 
                    nrounds             = 1000,
                    verbose             = 1,
                    watchlist           = watchlist,
                    maximize            = FALSE,
                    nfold               = 2,
                    nthread             = 2,
                    prediction          = T
)

ただし、そのオプションを使用してもprediction = T、トレーニング データから予測結果を取得しているだけです。clf結果のオブジェクト (この例では)predictを新しいデータを含むステートメントで使用する方法がわかりません。

私の理解は正確ですか?回避策はありますか?

4

1 に答える 1