問題タブ [xgboost]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R xgb.importance を使用した xgboost でエラーがスローされる
初めて CRAN の xgboost パッケージを使用しています。
モデルを次のように作成します。
電話xgb.importance
するとエラーが発生します:
Error in readLines(filename_dump) : 'con' is not a connection
理由はありますか?
r - xgboost がツリーをプロットしないのはなぜですか?
次のように xgboost モデルを実行しています。
可変重要度行列はうまくプロットされますが、次のようにすると
RStudio は新しいブラウザー ウィンドウを開き、大量の HTML を表示しますが、画像は表示しません。HTML には、グラフなどの作成に必要なスクリプトなどのすべての詳細が含まれていますが、これらの Java スクリプトを持っていないため、重要度マトリックスをプロットするように機能するはずだと考えていました。
私は何が欠けていますか?
xgboost - 勾配ブースティング手順 (xgboost) でパラメータ「重み」(DMatrix) はどのように使用されますか?
xgboost では、 のパラメーターを設定することができweight
ますDMatrix
。これは明らかに、各値が対応するサンプルの重みである重みのリストです。これらの重みが勾配ブースティング手順で実際にどのように使用されているかについての情報は見つかりません。それらは関連していeta
ますか?
たとえば、weight
すべてのサンプルを 0.3 に設定して 1 に設定すると、0.3に 1eta
に設定するのと同じことになりますか?eta
weight
python - シェルから実行すると Python モジュールが見つかりましたが、IPython からは見つかりませんでした
Windows 7 に Anaconda python をインストールしてから、次の手順に従って xgboost パッケージを手動でインストールしました: How to install xgboost package in python (windows platform)? (anaconda の下ではなく、別のディレクトリにインストールされます)
私はtest.pyに以下を入れました:
コマンド ラインから (たとえば、cygwin から) インポートすると、正常に機能します。しかし、Anaconda に付属の Spyder IDE または IPython を使用すると、
sys.executable を確認しましたが、シェルと IPython で同じ python を実行しています。print sys.path は、どちらの場合も適切な場所がパスの一部であることを示しています。何が起こっているのですか?IDE を使用できるようになりたいと思います。
python - XGBOOST Java API
XGBOOST ライブラリを使用して売上予測をしようとしています。しかし、私は Python よりも Java に精通しているため、Java API を使用しています。また、検証しようとしているもう 1 つのことは、同じデータセットを使用してモデルをトレーニングするときに、Python と Java を使用した場合にパフォーマンスに関連する利点があるかどうかです。
しかし、問題は、 Pandas、SciKitなどに対応する Python の同等のライブラリを見つけるのに苦労していることです。そのため、次のライブラリを使用して DataFrame を構築し、それらを操作しました。次に、それを CSV ファイルにダンプし、別のライブラリを使用してデータを読み取り、トレーニング データ セットと検証データ セットの 80/20 分割を実行します。データを XGBOOST ライブラリに読み込んで DMatrix を作成する前に、もう一度出力を CSV ファイルにダンプします。
ライブラリ:
- DataFrameの結合
- データを 80/20 に分割するための Weka
- モデリング用の公式 XGBOOST JVM パッケージ
これは、Java でこの分析を実行する効率的または正しい方法ではないことを私は知っています。しかし同時に、これがすべてJavaまたはJavaのライブラリを使用して行われている例は見当たりません。
ライブラリの Java 実装を使用してデータの XGBOOST 分析を実行した人がいるかどうかを確認したかったのです。また、パッケージを使用して DataFrame を作成した場合は、データをトレーニング データセットとテスト データセットに分割する前に、操作などを実行します。
どんな助けでも彼は高く評価します。
xcode - Mac に xgboost をインストールする - ld: ライブラリが見つかりません
Mac に OpenMP 対応の xgboost をインストールしようとしています。問題なくインストールgcc
しました:
次に、git リポジトリのクローンを作成します。
しかし、私が行うとエラーが発生します
これが私が得るエラーです。この問題の解決にご協力いただければ幸いです:
c++ - Mac での xgboost のインストールの失敗 - ar: アーカイブ メンバーが指定されていません
Macにxgboostをインストールしようとしています。githubの指示に従いましたが、実行するmake -j4
とエラーが発生します。
make
(なしで-j4
)実行すると、次のようになります。
これを引き起こしている原因と、それを修正する方法はありますか?
ar
間違っているかもしれませんが、Mac のアーカイブ ユーティリティが古すぎる (2005 年以降)ためだと思います。
ar
OS X で最新バージョンに更新する方法はありますか?
参照用のメイクファイルは次のとおりです。
どうもありがとう。
python - Mac の Xgboost パッケージ
Xgboost を使用しようとしていますが、インストールで問題に直面しています。私はMacを使用しており、同じためにpythonノートブックjupyterを使用しています。コマンドラインを開いて使用pip install xgboost
すると、正常にインストールされましたが、コードで使用しようとすると、
誰か助けてもらえますかimport xgboost as xg
? ImportError: No module named xgboost
python - xgboost: AttributeError: 'DMatrix' オブジェクトに属性 'handle' がありません
その部分は他のデータセットでかなりうまく機能したため、問題は本当に奇妙です。
完全なコード:
最後の行により、以下のエラーが発生します (完全な出力が提供されます)。
ここで何が問題なのですか?それを修正する方法がわかりません
UPD1: 実際、これは kaggle の問題です: https://www.kaggle.com/insaff/bnp-paribas-cardif-claims-management/xgboost
r - R で xgboost の num_classes を理解する
xgboost の num_classes を正しく設定する方法を理解するのに苦労しています。
アイリスデータを使用した例があります
これはエラーを返します
num_class を 2 に変更すると、同じエラーが発生します。num_class を 4 に増やすと、モデルは実行されますが、600 の予測確率が返されます。これは、4 つのクラスに対して意味があります。
エラーを起こしているのか、xgboost の仕組みを理解できていないのかわかりません。どんな助けでも大歓迎です。