属性削減のためにランダムフォレストを使用したい。私のデータにある問題の1つは、離散クラスがないことです。連続のみです。これは、例が「通常」とどのように異なるかを示しています。このクラス属性は、ゼロから無限大までの一種の距離です。そのようなデータにランダムフォレストを使用する方法はありますか?
1942 次
1 に答える
6
それは問題ではないはずです-RFは回帰モードに切り替わるだけです。パッケージrandomForest
の機能を使用します。次のように、引数と
オブジェクトの類似性を取得するには、次のようにします。randomForest
proximity=TRUE
randomForest(Sepal.Length~.,data=iris,proximity=TRUE)$proximity
node-purity(Gini-index like)属性の重要度を取得するには:
randomForest(Sepal.Length~.,data=iris)$importance[,"IncNodePurity"]
平均MSE増加(精度-減少のような)属性の重要性を取得するには:
randomForest(Sepal.Length~.,data=iris,importance=TRUE)$importance[,"%IncMSE"]
于 2010-07-07T20:35:02.937 に答える