問題タブ [windowing]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
80 参照

scala - ラベル列でウィンドウ関数を使用した後に XGBoost が失敗する

2 つの列を持つデータフレームである XGBoost モデルのトレーニングに成功しましtrainDFた。11kの 1 と 57M の 0 (不均衡なデータセット) があります。すべて正常に動作します。featureslabel

次に、ウィンドウ処理を使用して y ラベルを変更し、各グループで y ラベルをより早く予測できるようにします。

結果には、57M の 0 と 214k の 1 があります (行数はほぼ同じですが)。の列にNAs がなく、タイプは stillです。その後、xgboost は失敗します。"label"trainDFdouble (nullable=true)

必要に応じてログを含めることができます。私の混乱は、ウィンドウ機能を使用し、文字通り他の設定を変更しないと、XGB が失敗することです。これについて何か考えていただければ幸いです。