7

randomForest分類タスクにRプラットフォームのパッケージを使用しています。

rf_object<-randomForest(data_matrix, label_factor, cutoff=c(k,1-k))

ここで、kの範囲は0.1から0.9です。

pred <- predict(rf_object,test_data_matrix)

ランダムフォレスト分類子からの出力があり、それをラベルと比較しました。したがって、9つのカットオフポイントについて、精度、MCC、感度、特異度などのパフォーマンス測定値があります。

ここで、ROC曲線をプロットし、ROC曲線の下の領域を取得して、パフォーマンスがどれほど優れているかを確認します。Rのパッケージのほとんど(ROCR、pROCなど)には予測とラベルが必要ですが、感度(TPR)と特異度(1-FPR)があります。

カットオフ方法がROC曲線を作成するのに正しいか信頼できるかどうか、誰かが私に提案できますか?TPRとFPRを使用してROC曲線と曲線下面積を取得する方法を知っていますか?

また、次のコマンドを使用してランダムフォレストをトレーニングしようとしました。このように、予測は継続的であり、RROCRpROCパッケージに受け入れられました。しかし、これが正しい方法であるかどうかはわかりません。誰かがこの方法について私に提案できますか?

rf_object <- randomForest(data_matrix, label_vector)
pred <- predict(rf_object, test_data_matrix)

私の問題を読んでくれてありがとう!私はこれのために長い間サーフィンをしてきました。あなたの提案/アドバイスをありがとう。

4

1 に答える 1

15

クラス確率を出力してみませんか?このようにして、予測のランキングがあり、それを任意のROCパッケージに直接入力できます。

m = randomForest(data_matrix, labels)
predict(m,newdata_matrix,type='prob')

分類ツールとしてrandomForestを使用するにはlabels、因子のベクトルである必要があることに注意してください。

于 2012-09-18T12:16:36.887 に答える