4

(以前ここに投稿され、間違ったサブに投稿されました。情報が不十分で、閉じられました。編集しました。編集は削除されたようで、投稿は煉獄に委託されたので、再投稿して申し訳ありません。以前の投稿は復活する可能性があります/復活する必要があります)

dismoR では、 which uses を使用して、いくつかのブースト回帰ツリー、別名一般化ブースティング モデルを実行しましたgbm。私が現在いる場所に人々を連れて行くための再現可能な例:

library(dismo); data(Anguilla_train)
angaus.tc5.lr01 <- gbm.step(data=Anguilla_train, gbm.x = 3:13, gbm.y = 2, family = "bernoulli", tree.complexity = 5, learning.rate = 0.01, bag.fraction = 0.5)

ここから)。これにより、gbm モデル オブジェクト「angaus.tc5.lr01」が残ります。De'ath 2007 のように、分割 (折り畳み?) のデンドログラムを生成したい、つまり、ツリーをプロットしたいと思います (写真、左ペインを参照)。BUT: De'ath のプロットは単一の回帰ツリーであり、データセットからランダムに抽出された異なるデータ セットを使用して実行される可能性のある何千ものツリーの平均であるブースト回帰ツリーではありません。

ユーザーcklussは親切にも rpart を提案しましたが、それは によって生成されるモデルを必要とするrpartため、 によって生成される BRT/GBM では機能しませんgbm.step。同じことがprpfromにも当てはまりますrpart.plot

pretty.gbm.treein はgbm、選択された任意の 1 つのツリーの情報のマトリックスを抽出します (pretty.gbm.tree(angaus.tc5.lr01, i.tree=1)最初に試してください)。これが成功へのもっともらしいルートであるかどうか疑問に思っています。たとえば、使用可能なすべてのツリーを使用して平均化されたツリー マトリックスを作成するスクリプトを記述し、これをツリーのようなオブジェクトに変換します

人々はさまざまに似たような質問をしているが、ネット上の他の場所では成功していないように見える。BRT モデルは定期的に「ブラック ボックス」であると説明されているため、一般的な意見としては、モデルを詳しく調べて内部プロセスを表示する必要はない/できる/気にする必要はないというものです。

だれかが BRT について十分に知っgbmていて、アイデアを持っていれば、喜んで受け入れてくれるでしょう。ありがとう。

デスツリーダイアグラム

4

1 に答える 1

2

お気づきのように、ディシジョン ツリー アンサンブルの解釈は、個々のツリーの解釈よりもはるかに困難です。幾何学的には、デシジョン ツリー アンサンブルは、複雑で高次元の曲面の近似と考えることができます。目標は、近似に寄与する変数を見つけ、その効果を視覚化することです。

アンサンブルを解釈するための基本的な考え方は、「平均」ツリーを取得したり、個々のツリーのプロットを取得したりすることではなく、変数の「平均」効果を視覚化することです。文献では、これは予測子の「部分依存」です。他の変数を一定に保つ効果です。「部分依存性」がどのように推定されるかを説明するのは少し複雑ですが、それは観測iに対して予測子jのみを変化させることによって得られるモデルの暗黙の予測です。次に、 i個のすべての観測値で予測が平均化されます。詳細については、 Friedman & Popescue (2008)を参照してください。

次に、予測子の実際の値に対する予測子の推定された依存関係 (または私が「モデルの暗示」と呼ぶもの) の効果をプロットできます。これにより、予測子のモデルの暗黙の効果を確認できます。

幸いなことに、このようなプロットはdismo非常に簡単に取得できます。gbm.plot単一の予測変数については を参照し、 gbm.perspec2 つの予測変数を含む透視図については を参照してください。ビネットには例も示されています。モデルの解釈をさらに支援するためgbm.interactionsに、可能な 2 方向または 3 方向の相互作用を検出する方法を提供します。詳細については、この質問を参照してください。

于 2015-09-24T14:00:14.787 に答える