問題タブ [gbm]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - GBMルールの生成-コーディングアドバイス
私はRパッケージGBMを、おそらく予測モデリングの最初の選択肢として使用しています。このアルゴリズムには多くの優れた点がありますが、「悪い点」の1つは、モデルコードを使用してR以外の新しいデータを簡単にスコアリングできないことです。SASまたは他のシステムで使用できるコードを記述したいと思います( SAS(IMLへのアクセスなし))。
次のデータセット(GBMマニュアルから)とモデルコードがあるとしましょう:
pretty.gbm.tree
これで、次のように使用して個々の木を見ることができます
これは
マニュアルページ18は、次のことを示しています。
マニュアルに基づくと、最初の分割は、gbm1$var.names[3]
「X3」である3番目の変数(この出力ではゼロ)で発生します。変数は順序付き因子です。
したがって、分割は1.5であり、値'dおよびc' levels[[3]][1:2.5]
(これもゼロベース)が左ノードに分割され、他の値levels[[3]][3:4]
は右に移動することを意味します。
次に、ルールは、gbm1$var.names[2]
インデックス1の行のSplitVar=1で示されるように分割を続行します。
誰かがこのデータ構造を(ツリーごとに)移動するために何かを書き、次のようなルールを作成しましたか?
"X3 in('d'、'c')およびX2 <1.0309565491およびX3in('d')の場合、scoreTreeOne = -0.0102671518"
これが、このツリーの最初のルールが読み取る方法だと思います。
または、これを行うための最善の方法についてアドバイスがありますか?
r - カレットパッケージを使用してGBMの最適なパラメータを見つける
ブースティングにRGBMパッケージを使用して、10,000 X 932の次元の生物学的データの回帰を実行しています。特に、GBMパッケージに最適なパラメーター設定(n.trees、shrinkage、interaction.depth、n)を知りたいです。 minobsinnode)オンラインで検索したところ、RのCARETパッケージでそのようなパラメーター設定を見つけることができました。ただし、CaretパッケージをGBMパッケージと一緒に使用するのは難しいので、caretを使用して前述のパラメーターの最適な組み合わせを見つける方法を知りたいだけですか?これは非常に典型的な質問のように思われるかもしれませんが、私はカレットのマニュアルを読みましたが、それでもカレットをgbmと統合するのは困難です。特に、これらのパッケージの両方に非常に慣れていないためです。
r - Rキャレット/gbmコードは予測しません:dim(X)は正の長さでなければなりません
キャレットを使用して、gbm モデルに最適なパラメーターを見つけようとしています。このコードは、他のデータ セットで使用したものと同じで、エラーを特定できません。
モデルを実行しているようですが、予測を作成できません。
完全なコードは次のとおりです。
助言がありますか?
編集:私は使用gbm 2.1
していますcaret 5.16.24