2 クラスの問題の予測確率を使用して ROC 曲線を描く必要があります。ROC 曲線を生成するには、確率に異なるカットオフを使用する必要があります。
ランダムフォレストを使用してクラス確率を予測しています
mydata<-read.table(file="out-all-gm-pr-hpcuts-wor-noAl.tr", header=TRUE, sep ="")
mydata$class <- as.factor(mydata$class)
mydata.rf<-randomForest(class ~ ., data=mydata, importance = TRUE, mtry = 3, ntree = 100, proximity = TRUE )
上記のフォレストを使用したテスト データの予測
mytestdata<-read.table(file="gmsim-craboff.tes",header=TRUE)
testpred<-predict(mydata.rf,mytestdata,type='prob')
これで、真のクラス ラベルとテスト データの予測確率を含むデータ ファイルができました。確率0.1
で異なるカットオフ (たとえば、、、、、)0.3
を使用0.5
し0.7
てROC 曲線を生成する必要があります。0.9
それについてどうやって行くのですか?