明確にしたいのですがvaex.ml.sklearn
、アウトオブコア ML を実行できますか? ドキュメントの例を使用しようとすると、xgboosting プロセスで hdf5 ファイルのデータセットを使用すると (評価されたデータセットは約 3 Gb の RAM を消費します)、RAM の使用量は約 7 ~ 8 Gb になります。単純に、アウトオブコアはそれほど多くの RAM を消費しないと想定しました。私は何を間違っていますか?
私のコードは
import vaex.ml.sklearn
xgb_model = xgboost.sklearn.XGBRegressor(max_depth=4,
learning_rate=0.1,
n_estimators=100,
subsample=0.75,
random_state=42,
)
vaex_xgb_model = vaex.ml.sklearn.Predictor(features=features,
target='target',
model=xgb_model,
prediction_name='prediction_xgb')
vaex_xgb_model.fit(df_train)
df_train = vaex_xgb_model.transform(df_train)
features
〜40項目のリストはどこにありますか。