かなり小さなデータセット (つまり、11 変数のうち 28 個の観測値) で 100,000 個の分類木のランダム フォレスト分析を実行しました。
次に、変数の重要度のプロットを作成しました
結果のプロットでは、少なくとも 1 つの重要な変数について、%IncMSE と IncNodePurity の間に実質的な不一致があります。実際、前者では重要度が 7 番目 (つまり、%IncMSE<0) に見える変数ですが、後者では 3 番目です。
この不一致をどのように解釈すればよいか、誰かが教えてくれますか?
問題の変数は、両方のグラフで一貫して 2 番目に表示される他の 1 つの変数と有意に相関しています。これは手がかりになるでしょうか?