曲線下面積 (AUC) を使用して分類器を評価する受信者動作特性 (ROC) 曲線を作成しています (詳細は記事の最後にあります)。残念ながら、曲線上の点はしばしば対角線より下になります。たとえば、次のようなグラフになります (青色の ROC 曲線、灰色のアイデンティティ ライン)。
3 番目の点 (0.3, 0.2) は、対角線の下になります。AUC を計算するには、このような難しい点を修正したいと考えています。
これを行う標準的な方法は、曲線上の点 (fp, tp) を点 (1-fp, 1-tp) に置き換えることです。これは、分類子の予測を交換することと同じです。たとえば、この例では、厄介な点 A (0.3, 0.2) が点 B (0.7, 0.8) になり、上のリンクの画像で赤で示しています。
これは、この問題を扱う際の私の参考文献の範囲です。問題は、新しいポイントを新しい ROC に追加する (そして悪いポイントを削除する) と、次のように非単調 ROC 曲線になることです (赤が新しい ROC 曲線で、青い点線が古い曲線です)。
そして、ここで私は立ち往生しています。この ROC 曲線を修正するにはどうすればよいですか?
この奇妙な動作を考慮して、何らかの方法で変換されたデータまたはクラスで分類器を再実行する必要がありますか? 関連する論文を調べましたが、間違っていなければ、これとは少し異なる問題に取り組んでいるようです。
いくつかの詳細については、元のしきい値、fp 値、および tp 値 (および各データ ポイントの元の分類子の出力、確率推定値である 0 から 1 までの単なるスカラーである出力) がまだすべて残っています。クラスのメンバーシップの)。perfcurve 関数から始めて、Matlab でこれを行っています。