Python で xgboost 分類子を作成しました。
train は、10 万行と 50 個の機能を列として持つ pandas データフレームです。対象はパンダシリーズ
xgb_classifier = xgb.XGBClassifier(nthread=-1, max_depth=3, silent=0,
objective='reg:linear', n_estimators=100)
xgb_classifier = xgb_classifier.fit(train, target)
predictions = xgb_classifier.predict(test)
ただし、トレーニング後、この分類器を使用して値を予測すると、結果配列全体が同じ数値になります。なぜこれが起こっているのでしょうか?
データの明確化: ~50 の数値的特徴と数値目標
RandomForestRegressor
同じデータを使用して sklearn からも試してみましたが、現実的な予測が得られます。おそらく xgboost 実装の正当なバグでしょうか?