問題タブ [xgboost]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - xgboost の DMatrix インスタンスからデザイン マトリックスを取得する
xgboostでは、次のようなことをしています
dtrain から y 値を配列として抽出したい場合は、次のようにします。
dtrain から X 値を配列として抽出する方法はありますか?
python - WindowsのPythonにxgboostをインストールしようとしています
私は、Windows 10 の Python に xgboost をインストールしようとして夢中になっています。いくつかの提案された記事を調べましたが、まだ適切な解決策が見つからないようです。誰かがこれを行ったことがある場合は、あなたの方法を親切に共有してください。他の提案も歓迎します。
感謝
c++ - C++ のファイルから DMatrix をロードする (xgboost パッケージ)
xgboost R パッケージを使用してモデルをトレーニングしました。C/C++ 環境で予測を行いたい。トレーニング済みのモデルを R から保存し、C コードに読み込むことに成功しました。
R で使用したテスト データを (DMatrix として) 保存し、それを C プログラムに読み込んで、予測を行うことで、このコードをテストしたいと考えています。
RI では、xgb.Dmatrix.save() コマンドを使用して、テスト データをファイルに保存しました。私のCコードは次のようになります:
このコードはコンパイルされますが、実行時に次のエラーで失敗します。
dmlc-core/include/dmlc/logging.h:245: [13:57:27] src/data/data.cc:51: チェックに失敗しました: (バージョン) == (kVersion) MetaInfo: 無効な形式
xgboost に適切な形式で保存/ロードするように指示する方法について何か提案はありますか?
どんな手がかりも役に立ちます。
r - sparse.model.matrix と as.matrix の違い
R で xgboost を使用して、トレーニング データセットで分類モデルを構築していtrain
ます。train
以下の属性を持っています。
- すべての数値機能を備えています
- 欠損値はありません。
- カテゴリ/テキスト/因子変数は存在しません。
TARGET
1/0 の値をとるターゲット変数です。
xgb.train ではデータを特定の形式で渡す必要があるため、xgb.train で必要な形式を取得するために次の 2 つの方法を試しました。
1.
2.
xgtrain
さて、これら 2 つの作成方法によって構築されたモデルを使用してテスト セットをスコアリングすると、異なるスコア/AUC が得られます。1番目の方法または2番目の方法を2回/ 3回実行するとスコアを再現できたため、ランダム化の問題ではないことを確認しました。私が理解できなかった2つの方法で、何かが異なって起こっています。誰かがその違いを特定するのを手伝ってもらえますか?
別の言葉で質問します。
提供されたデータに欠損値やカテゴリ変数がない数値特徴のみが含まれている場合との違いは何ですか?sparse.model.matrix
as.matrix
r - R で xgboost (xgb.cv) を使用して交差検証されたモデルを交差検証して保存することは可能ですか?
R のほとんどすべての機械学習パッケージ/関数を使用すると、モデルのトレーニング中に相互検証パフォーマンス メトリックを取得できます。
私が知る限り、xgboost で相互検証を行う唯一の方法は、次のxgb.cv
ようなステートメントを設定することです。
ただし、そのオプションを使用してもprediction = T
、トレーニング データから予測結果を取得しているだけです。clf
結果のオブジェクト (この例では)predict
を新しいデータを含むステートメントで使用する方法がわかりません。
私の理解は正確ですか?回避策はありますか?
r - R の xgboost モデルからの部分依存プロット
Rのxgboostモデルから部分依存プロットを取得する既存の関数はありますか? パッケージの使用例を見ましたが、固有のラッパー クラスmlr
が必要なようです。モデルをそのクラスmlr
に変換する方法があるかどうかは少しわかりません。xgboost
xgboost - Xgboost ノードは、機能範囲外の値で分割されますか?
0 から 1 の範囲の機能がいくつかあります。しかし、モデルをダンプすると、一部のノードが「機能 < 2.00001」を使用してこれらの機能を分割していることがわかります。xgboost は機能をスケーリングしたり、機能に何らかの価値を追加したりしますか? または、なぜ 2.00001 が分割に選ばれたのでしょうか? ありがとう〜