問題タブ [gbm]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
4260 参照

r - GBMルールの生成-コーディングアドバイス

私はRパッケージGBMを、おそらく予測モデリングの最初の選択肢として使用しています。このアルゴリズムには多くの優れた点がありますが、「悪い点」の1つは、モデルコードを使用してR以外の新しいデータを簡単にスコアリングできないことです。SA​​Sまたは他のシステムで使用できるコードを記述したいと思います( SAS(IMLへのアクセスなし))。

次のデータセット(GBMマニュアルから)とモデルコードがあるとしましょう:

pretty.gbm.treeこれで、次のように使用して個々の木を見ることができます

これは

マニュアルページ18は、次のことを示しています。

ここに画像の説明を入力してください

マニュアルに基づくと、最初の分割は、gbm1$var.names[3]「X3」である3番目の変数(この出力ではゼロ)で発生します。変数は順序付き因子です。

したがって、分割は1.5であり、値'dおよびc' levels[[3]][1:2.5](これもゼロベース)が左ノードに分割され、他の値levels[[3]][3:4]は右に移動することを意味します。

次に、ルールは、gbm1$var.names[2]インデックス1の行のSplitVar=1で示されるように分割を続行します。

誰かがこのデータ構造を(ツリーごとに)移動するために何かを書き、次のようなルールを作成しましたか?

"X3 in('d'、'c')およびX2 <1.0309565491およびX3in('d')の場合、scoreTreeOne = -0.0102671518"

これが、このツリーの最初のルールが読み取る方法だと思います。

または、これを行うための最善の方法についてアドバイスがありますか?

0 投票する
2 に答える
22266 参照

r - カレットパッケージを使用してGBMの最適なパラメータを見つける

ブースティングにRGBMパッケージを使用して、10,000 X 932の次元の生物学的データの回帰を実行しています。特に、GBMパッケージに最適なパラメーター設定(n.trees、shrinkage、interaction.depth、n)を知りたいです。 minobsinnode)オンラインで検索したところ、RのCARETパッケージでそのようなパラメーター設定を見つけることができました。ただし、CaretパッケージをGBMパッケージと一緒に使用するのは難しいので、caretを使用して前述のパラメーターの最適な組み合わせを見つける方法を知りたいだけですか?これは非常に典型的な質問のように思われるかもしれませんが、私はカレットのマニュアルを読みましたが、それでもカレットをgbmと統合するのは困難です。特に、これらのパッケージの両方に非常に慣れていないためです。

0 投票する
2 に答える
3112 参照

r - Rキャレット/gbmコードは予測しません:dim(X)は正の長さでなければなりません

キャレットを使用して、gbm モデルに最適なパラメーターを見つけようとしています。このコードは、他のデータ セットで使用したものと同じで、エラーを特定できません。

モデルを実行しているようですが、予測を作成できません。

完全なコードは次のとおりです。

助言がありますか?

編集:私は使用gbm 2.1していますcaret 5.16.24