問題タブ [xgboost]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
xgboost - xgboost TypeError: DataFrame から DMatrix を初期化できません
Python でデータから DMatrix を作成すると、以下のエラーが発生します。
TypeError: データフレーム例外から DMatrix を初期化できません
AttributeError: "'DMatrix' object has no attribute 'handle'" in <bound method DMatrix.__del__ ofrix object at 0x584d210>> は無視されました
r - 最適化に mlogloss を使用するようキャレットで xgboost に指示する方法
マルチクラスの問題があります。たとえば、データセット データmtcars
セットを取得して、シリンダ数を予測したいとしcyl
ます。
パッケージxgboost
を使って装着して使いたい。caret
そのために、次を使用してハイパーパラメータのグリッドを作成します
トレーニング制御パラメーターを次のように作成できます
)
次に、次を使用してtrain
関数を実行しようとするとcaret
:
エラーが発生します::
このエラーを修正する方法と、学習を最適化するxgbTree
ために使用するように指示する方法を教えてください。mlogloss
python - WindowsのPythonでXGBoostパッケージをインストールするにはどうすればよいですか
XGBoost パッケージを Python にインストールしようとしました。Windows OS、64ビットを使用しています。私は次のことを経験しました。
パッケージ ディレクトリには、xgboost は Windows では不安定であり、無効になっていると記載されています。Windows への pip のインストールは現在、詳細な調査のために無効になっています。github からインストールしてください。 https://pypi.python.org/pypi/xgboost/
私は Visual Studio に精通しておらず、XGBoost のビルドで問題に直面しています。データ サイエンスで xgboost パッケージを利用する機会がありません。
PythonでXGBoostパッケージをインポートできるように、ガイドしてください。
ありがとう
r - XGBoost - 露出/オフセットが変化するポアソン分布
XGBoost を使用して、不均等な露出期間から生成されたデータのクレーム頻度をモデル化しようとしていますが、露出を正しく処理するモデルを取得できませんでした。私は通常、ログ(露出)をオフセットとして設定することでこれを行います-XGBoostでこれを行うことができますか?
(同様の質問がここに投稿されました: xgboost, offset Exposure? )
この問題を説明するために、以下の R コードはフィールドを使用していくつかのデータを生成します。
- x1、x2 - 係数 (0 または 1)
- 露出 - 観察されたデータのポリシー期間の長さ
- 頻度 - 単位エクスポージャーあたりのクレームの平均数
- クレーム - 観測されたクレームの数 ~ポアソン(頻度*露出)
目標は、x1 と x2 を使用して周波数を予測することです。実際のモデルは、x1 = x2 = 1 の場合は周波数 = 2、それ以外の場合は周波数 = 1 です。
エクスポージャーは、ポリシーの開始時にはわからないため、頻度を予測するために使用することはできません。これを使用できる唯一の方法は、次のように言うことです。クレームの予想数 = 頻度 * 露出。
コードは、XGBoost を使用して次のように予測しようとします。
- モデル マトリックスで露出を重みとして設定する
- ログ(露出)をオフセットとして設定
これらの下に、ツリー (rpart) または gbm の状況を処理する方法を示しました。
machine-learning - xgboost (または他のアルゴリズム) は、いくつかの悪い機能で悪い結果をもたらす可能性がありますか?
今まで、機械学習アルゴリズム (gbm、ランダム フォレスト、xgboost など) がデータに存在する悪い機能 (変数) を処理できるという印象を受けていました。
私の問題の 1 つでは、約 150 の機能があり、xgboost を使用すると、すべての機能を使用すると約 1 の対数損失が発生します。しかし、約 10 個の悪い機能 (何らかの手法を使用して見つかったもの) を削除すると、対数損失が 0.45 になります。それは大きな改善です。
私の質問は、悪い機能が本当にそんなに大きな違いを生むのでしょうか?
r - OS XでOpenMPコンパイルを使用してRパッケージxgboostを並列化するには?
R で xgb.cv と xgboost を使用しています。
私のコード例は次のとおりです
ただし、上記のコードは機能しません。それらを平行にするために私は何をしなければなりませんか?
xgboostウェブサイトとgithubでこれを見つけたことがあります
しかし、私は走ることができません
また
sudoでも機能しませんありがとう