Rでの分類にランダムフォレストパッケージを使用しようとしています.
リストされている可変重要度メジャーは次のとおりです。
- クラス 0 の変数 x の生の重要度スコアの平均
- クラス 1 の変数 x の生の重要度スコアの平均
MeanDecreaseAccuracy
MeanDecreaseGini
今、私はそれらの定義を知っているように、これらの「意味」を知っています。私が知りたいのは、それらの使い方です。
私が本当に知りたいのは、これらの値がどれほど正確であるか、良い値とは何か、悪い値とは何か、最大値と最小値などのコンテキストでのみ、これらの値が何を意味するかです.
変数の値が高い場合、それは重要か重要でないかMeanDecreaseAccuracy
? MeanDecreaseGini
また、生のスコアに関する情報も役立ちます。それらの適用に関連するこれらの数値について知っておくべきことをすべて知りたい.
「エラー」、「合計」、または「順列」という言葉を使用する説明は、ランダム フォレストがどのように機能するかについての議論を含まない単純な説明よりも役に立ちません。
ラジオの使い方を誰かに説明してほしいと思ったとしても、ラジオが電波を音に変換する仕組みが説明されているとは思いません。