R で 3 クラス ROC 分析の問題に遭遇し、非常に厄介な結果が得られました (こちらを参照)。今、私はそれを解決するために別の方法を使用しようとしています。データはあり、分類子はパッケージiris
に含まれている多項ロジスティック回帰です。nnet
コードは以下のとおりです。
# iris data (3-class ROC)
library(nnet)
library(pROC) # should be installed first: install.packages('pROC')
data(iris)
# 3-class logistic regression
model = multinom(Species~., data = iris, trace = F)
# confusion matrix (z1) & accuracy (E1)
z1 = table(iris[, 5], predict(model, data = iris))
E1 = sum(diag(z1)) / sum(z1)
z1;E1
# setosa versicolor virginica
# setosa 50 0 0
# versicolor 0 49 1
# virginica 0 1 49
#[1] 0.9866667
# prediction model (still training data set)
pre = predict(model, data = iris, type='probs')
# AUC measure
modelroc = mean(
c(as.numeric(multiclass.roc(iris$Species, pre[,1])$auc),
as.numeric(multiclass.roc(iris$Species, pre[,2])$auc),
as.numeric(multiclass.roc(iris$Species, pre[,3])$auc)
)
)
modelroc
## RESULT ##
# [1] 0.9803556
私の質問は次のとおりです:これはパッケージ
を使用する正しい方法ですか? pROC
どうもありがとう!!!
関連参照:
pROC
パッケージ: http://www.inside-r.org/packages/cran/pROC/docs/multiclass.roc
Hand & Till(2001)
元の論文: http://link.springer.com/article/10.1023%2FA%3A1010920819831