randomForest
分類タスクにRプラットフォームのパッケージを使用しています。
rf_object<-randomForest(data_matrix, label_factor, cutoff=c(k,1-k))
ここで、kの範囲は0.1から0.9です。
pred <- predict(rf_object,test_data_matrix)
ランダムフォレスト分類子からの出力があり、それをラベルと比較しました。したがって、9つのカットオフポイントについて、精度、MCC、感度、特異度などのパフォーマンス測定値があります。
ここで、ROC曲線をプロットし、ROC曲線の下の領域を取得して、パフォーマンスがどれほど優れているかを確認します。Rのパッケージのほとんど(ROCR、pROCなど)には予測とラベルが必要ですが、感度(TPR)と特異度(1-FPR)があります。
カットオフ方法がROC曲線を作成するのに正しいか信頼できるかどうか、誰かが私に提案できますか?TPRとFPRを使用してROC曲線と曲線下面積を取得する方法を知っていますか?
また、次のコマンドを使用してランダムフォレストをトレーニングしようとしました。このように、予測は継続的であり、RROCR
のpROC
パッケージに受け入れられました。しかし、これが正しい方法であるかどうかはわかりません。誰かがこの方法について私に提案できますか?
rf_object <- randomForest(data_matrix, label_vector)
pred <- predict(rf_object, test_data_matrix)
私の問題を読んでくれてありがとう!私はこれのために長い間サーフィンをしてきました。あなたの提案/アドバイスをありがとう。