6

次のROC曲線があります。

ROC曲線

そして、たとえば私の予測にはゼロが含まれているため、1.0で終わらない

予測=[0.9、0.1、0.8、0.0]

ROC曲線の場合、最初に{0.9}、次に{0.9、0.8}などの上位k個の予測を使用します。予測に0より大きい値がなくなった場合、kの増加に伴って予測は変化しなくなります。

したがって、ゼロの真の負の値を取得することはできません。また、偽陽性率はfp /(fp + tn)であるため、曲線は1に達する前に終了します。

さて、予測にも人為的にゼロを使用する必要がありますか、それとも曲線がそのように終わっても大丈夫ですか?ゼロを使​​用するのも間違っていると感じます。それとも私は何かが足りないのですか?

4

2 に答える 2

8

ROC曲線は、しきい値をさまざまな値に設定した場合に、誤検知と誤検知の間で発生する可能性のあるトレードオフを示しています。極端な場合は、しきい値を低く設定してすべてを陽性とラベル付けし、偽陰性率を0、偽陽性率を1にすることができます。もう一方の極端な場合は、しきい値を高く設定してすべてにラベルを付けることができます。陰性として、偽陰性率1と偽陽性率0を与えます。

これらの縮退したケースは実際には有用ではありませんが、理論的には有効なトレードオフであり、ROC曲線の正常な部分です。

于 2012-08-31T15:51:27.527 に答える
1

はい、もちろん!アンチモンが前述したように、ROC曲線は、偽陽性率と真陽性率の間のトレードオフを示すために使用されます。データでニューラルネットをトレーニングし、モデルを実行した時間の90%で偽陽性率が0になった(fpが0だったため)ことを覚えています。素晴らしかったです!私のTPRはほとんどの場合1だったので、ROC曲線は、ほとんどがy軸(TPR軸)上のいくつかの点であったため、ちょっと奇妙でした。

FPRが特定の値を超えないため、モデルは正常に機能しています。

例として、特定の入力変数について、私のモデルは次のように機能しています。予測出力:[0.97、5.78E-4、6.15E-4]実際の出力:[1.0、0.0、0.0]

対応するクラス1の予測値である最初の値は、他の2つの値と簡単に区別できるため、モデルが完全に予測していることがわかります。また、他の2つの値、つまり[5.78E-4、6.15E-4]は、0.97と比較して非常に小さいためです。カットオフごとに0.97が1にマップされ、他の2つの値が0にマップされます。カットオフが何であっても、TPRは高く、FPRはゼロであることがわかります。

于 2016-11-06T02:51:53.653 に答える