これは、Rのランダムフォレストの出力に対応する質問です。
、、が何を表しているのか理解していgini
ます。私は多数の異なる応答変数を持っており、多くの異なるランダムフォレストを(各コースで別々に) 計算しています。impurity
mean accuracy plots
結果として得られる上位の予測子は、通常、2つの出力プロット間でかなり類似しています(平均精度とノード純度)。私を混乱させているのは、ノードの純度が高い(その後に大きなブレークが続く)単一の変数を持つ1つの出力がありますが、平均精度プロットのこの同じ変数は非常に低いです。ほぼ底に。
私が読んだことや、このフォーラムですでに与えられている他の回答を正しく解釈している場合は、
- 同じ変数の重要度(ノードの純度)は高いが、精度は非常に低いのはなぜですか?これは私には意味がないようで、私の結果を疑わせます。
どんな洞察も大歓迎です!