5

RパッケージrandomForestレポートは、フォレスト内の各ツリーの二乗誤差を意味します。ただし、データの各ケースの信頼度を測定する必要があります。randomForestは、単一ツリーの予測を平均することによってケースごとの予測を計算するため、ケースごとの標準誤差、したがって信頼区間も計算できるはずですこれは、出力のrandomForestオブジェクトを使用して実行できますか(ある場合:どのように?)、またはソースコードを掘り下げる必要がありますか?

4

1 に答える 1

7

ソースコードを掘り下げる必要はありません。ドキュメントを読むだけです。?predict.randomForestその引数の1つが呼び出されると述べていますpredict.all

Forecast.all すべての木の予測を維持する必要がありますか?

したがって、これをに設定するTRUEと、各ケース、各ツリーの予測が保持され、これを使用して各ケースの標準誤差を計算できます。

私は最近、Stefan Wager、Trevor Hastie、Brad Efronによってこの論文に気づきました。この論文は、ランダムフォレスト(およびその他の袋に入れられた予測子)によって生成される予測の標準誤差の概念をより厳密に調査しています。

于 2013-02-05T15:26:02.533 に答える