3

私は2つのスクリプトを持っており、どちらもRでランダムフォレストを生成します。私の問題はそうではないことを示唆していますが、私が理解できる限り、同じ入力を持っています。それらの1つは、以下を含む重要度テーブルを返します

row.names importance.blue importance.red importance.MeanDecreaseAccuracy importance.MeanDecreaseGini

他の重要度テーブルには

row.names   MeanDecreaseGini

これらの2つのフォレストの違いは何ですか。さらに重要なのは、同じ入力であると私が考えたものを考えると、違いの原因は何ですか。

(スクリプトは大きすぎてここに貼り付けることはできませんが、どちらも連続変数の束に基づいて因子を予測しようとしています)

4

1 に答える 1

6

randomForestのヘルプページには、重要性(分類に使用される場合)はnclass+2​​列の行列であることが示されています。最初のnclass列は、精度の平均低下として計算されたクラス固有の測定値です。nclass + 1番目の列は、すべてのクラスでの精度の平均低下です。最後の列は、ジニ係数の平均減少です。重要度=FALSEの場合でも、最後のメジャーはベクトルとして返されます。

したがって、あなたは、importance = TRUEで1回、importance=FALSEで1回randomForestを呼び出したように見えます。

于 2012-07-30T14:06:12.113 に答える