私は自分のデータで初めてgbmを使用しようとしています(実際には初めてあらゆる種類の回帰ツリー)。これは、14個の連続従属変数と13レベルの応答変数としての因子で構成されています。私は、多項分布を処理できない基本的なgbmパッケージの変更を使用した、Elithetal。による非常に優れた説明を介してgbmに到達しました。gbmの助けは、これを処理できると主張しています。
"分布:使用する分布の名前を指定する文字列、または分布と必要な追加のパラメーターを指定するコンポーネント名のリストのいずれか。指定されていない場合、gbmは推測を試みます。応答に一意が2つしかない場合値の場合、ベルヌーイが想定されます。それ以外の場合、応答が因子の場合は多項分布が想定されます。それ以外の場合、応答のクラスが「Surv」の場合はcoxphが想定されます。それ以外の場合は、ガウス分布が想定されます。現在使用可能なオプションは「ガウス」(二乗誤差)です。 )、 "laplace"(絶対損失)、 "tdist"(t分布損失)、 "bernoulli"(0-1結果のロジスティック回帰)、 "huberized"(0-1結果のhuberizedヒンジ損失)、 "多項」(2つ以上のクラスがある場合の分類)、「adaboost」(0-1の結果に対するAdaBoostの指数損失)、「ポアソン」(結果のカウント)、「coxph」(右打ち切り観測値)、「分位数」、または「ペアワイズ」(LambdaMartアルゴリズムを使用したランク付け測定)。
それでも、「多項」を指定するか「推測させる」かを指定しても、機能しません。私が間違っていることを誰かが知っていますか?または、私は何かを完全に誤解していますか?データの多項分布は、エラー損失関数も多項分布であることを意味しませんか?「ガウス」を選択すると実行されますが、その場合はまったく異なるものが計算されると思いますか?助けていただければ幸いです!アグネス