4

ROC 曲線は TPR と FPR をプロットし、トレーニング セットの確率の順位に基づいてしきい値を変化させます。選択されるしきい値は、左上隅のポイントに関連付けられた確率です。これにより、基本的に TPR が最大化され、誤検知率が最小化されます。

しかし、私のアプリケーションが偽陰性率を最小限に抑えることについて話しているとしましょう。では、この曲線はどのように変化するでしょうか。両者のバランスはどうですか?

4

2 に答える 2

7

ROC曲線とは何かを誤解しているようです。

ROC 曲線は、しきい値が変化するにつれて TPR と FPR をプロットします。その結果、ROC 曲線は実際には 3 次元グラフであり、FPR、TPR、およびしきい値の 3 つの変数間の関係がプロットされます。グラフの各点は、特定のしきい値に対する実際の TPR と FPR を反映しています。グラフの左下隅には常にしきい値 1 が反映され、右上隅にはしきい値 0 が反映されます。

ROC 曲線には通常 2 つの用途があります。しきい値に関係なく 2 つの異なるモデルを比較することと、適切なしきい値を選択することです。予測分析アプリケーションの「適切なしきい値」は、攻撃している特定の問題に基づいてかなり異なりますが、一般に、ROC 曲線を使用して、特定のアプリケーションに許容できる TPR/FPR トレードオフでしきい値を選択できます。 . 左上隅に最も近いポイントのしきい値を選択するだけで理想的な結果が得られることはめったにありません。

ROC 曲線から理想的なしきい値を選択したら、混同行列とその他の評価指標 (精度、再現率、精度、F1 など) を調査して、しきい値をさらに評価できます。

直接の質問に答えるには、ROC 曲線が FNR を直接示していないことは正しいです。この場合、ROC 曲線と同様の方法で TPR と TNR をプロットする感度/特異度グラフを使用できます。私が知る限り、FNR を直接見る標準的な評価方法はありません。代わりに、通常はデータの「正」と「負」のラベルを入れ替えて、ROC 曲線を再プロットします。これにより、(事実上) TNR 対 FNR が得られます。

于 2016-04-06T15:20:19.197 に答える