問題タブ [xgboost]

質問する

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

2400 問題

0 投票する

1 に答える

163 参照

r - R xgboost パッケージパラメーターの関係

eval_metricドキュメントを読んだ後、maximizeパラメーター間の違いと関係が100％明確ではありませんfeval。

たとえば、線形回帰を実行しているときeval_metricに、カスタムカッパ関数に設定すると、maximize= TRUE になります。eval_metricとはどう違いfevalますか？

ありがとう！

r xgboost

2016-01-16T23:48:16.010

0 投票する

0 に答える

1544 参照

python - XGboost カスタム目的関数を実装する

XGboost を使用してカスタム目的関数を実装しようとしています (R では、Python も使用しているため、Python に関するフィードバックも良いです)。

勾配とヘシアンを吐き出す関数を作成しました (正しく動作します) が、xgb.train を実行しようとすると動作しません。次に、ラウンドごとに、予測、勾配、およびヘシアンをこの特定の順序で出力することにしました。これは出力です（実行している限り繰り返します）：

[1] 0 0 0 0 0 0 0 0 0

[1] -0.034106908 -0.017049339 -0.034106908 -0.034106908 -0.034106908 -0.034106908 -0.034106908 -0.004256162 -0.034106908 -0.008520554

[1] 0.003836107 0.004272548 0.003836107 0.003836107 0.003836107 0.003836107 0.003836107 0.004408935 0.003836107 0.004381658

[0] トレーニングスコア:0 バリュースコア:0

[1] 0 0 0 0 0 0 0 0 0

[1] -0.034106908 -0.017049339 -0.034106908 -0.034106908 -0.034106908 -0.034106908 -0.034106908 -0.004256162 -0.034106908 -0.008520554

[1] 0.003836107 0.004272548 0.003836107 0.003836107 0.003836107 0.003836107 0.003836107 0.004408935 0.003836107 0.004381658

[1] train-score:0 val-score:0

勾配とヘシアンが問題ないように見えても、各ラウンドの予測は変わらないことがわかります!! なぜそうなのかわかりません。誰かが同じ問題に遭遇した場合、またはアイデアを共有してください。

私が使用するコードは次のとおりですが、あまり役に立たないと思います。

python r xgboost

2016-01-17T16:57:47.193

0 投票する

2 に答える

6118 参照

r - xgboost、オフセット露出?

R で請求頻度 (ポアソン分布) をモデル化しています。gbmとxgboostパッケージを使用しxgboostていますが、エクスポージャーを考慮に入れるためのオフセットパラメーターがないようです。

では、gbm次のように露出を考慮します。

`xgboostで同じことを達成するにはどうすればよいですか?

PS: クレームが観察されるたびに新しい観測点が作成されるため、露出を予測因子として使用することはできません。

r xgboost

2016-01-20T09:21:46.940

0 投票する

2 に答える

1488 参照

r - XGboost(R)で損失行列を変更するには?

偽陰性よりも偽陽性のコストが高いバイナリ変数を分類したいと考えています。

rpartパッケージでは、損失行列を使用します。負の例を正として誤分類するコストを追加するparms = list(loss=matrix(c(0,1,5,0),nrow=2))と、正の例を負として誤分類するコストの 5 倍になります。

どうすればそれを行うことができXGboostますか?

r machine-learning xgboost

2016-01-25T11:33:21.287

0 投票する

1 に答える

4270 参照

r - 取得する理由: xgboost で mlr を使用しているときに、ラベルの長さは入力データの行数と同じである必要があります。

次の R コードを実行した後:

str(data) を実行すると、次のようになります。

タスクの概要は次のとおりです。

次に、エラーが発生します。

このエラーを回避するための助けをいただければ幸いです。ありがとう。

r xgboost mlr

2016-01-29T22:32:59.613

0 投票する

1 に答える

8010 参照

python - xgboost バイナリロジスティック回帰

次の例に要約できる xgboost でロジスティック回帰を実行する際に問題があります。

2 つの予測子と 1 つのターゲット変数を持つ非常に単純なデータフレームがあるとします。

ここに新しいので画像を投稿できますが、X1 = 1およびX2 = 0の場合、Yは0であり、X1 = 0およびX2 = 1の場合、Yは1であることがはっきりとわかります.

私の考えは、観測が各クラスに属する確率を出力するモデルを構築することです。そのため、xgboost を実行して 2 つの新しい観測 (1,0) と (0,1) を予測しようとすると、次のようになります。

出力は次のとおりです。

これは、最初の観測では、それが各クラスに属する可能性が 50% あることを意味すると思います。

変数間の関係が明確な場合、アルゴリズムが適切な (1,0) またはそれに近いものを出力しない理由を知りたいです。

参考までに、より多くのデータを試してみましたが (簡単にするために 4 行のみを使用しています)、動作はほぼ同じです。私が気付いたのは、確率の合計が 1 にならないだけでなく、多くの場合、そのように非常に小さいことです: (この結果は別のデータセットでのものであり、上記の例とは関係ありません)

python machine-learning regression logistic-regression xgboost

2016-02-01T17:15:02.717

1 2 3 4 5 6 7 8 9 10

問題タブ [xgboost]

r - R xgboost パッケージ パラメーターの関係

python - XGboost カスタム目的関数を実装する

r - xgboost、オフセット露出?

r - XGboost(R)で損失行列を変更するには?

r - 取得する理由: xgboost で mlr を使用しているときに、ラベルの長さは入力データの行数と同じである必要があります。

python - xgboost バイナリ ロジスティック回帰

Reference

r - R xgboost パッケージパラメーターの関係

python - xgboost バイナリロジスティック回帰