データの 20% がネガティブ クラスで、80% がポジティブなデータセットがあります。F スコアを計算するとき、精度は TP/(TP+FP) であると仮定します。頻度の低いクラスが負であるため、数式を「反転」する必要がありますか? TN/(TN+FN) でしょうか?
1258 次
1 に答える
2
まず、あなたが書いているのはF1スコアではありません。それがプレシジョンです!
F1スコアを計算するには、precision=TP/(TP+FP)とrecall=TP/(TP+FN)を設定します。それらの調和平均が F1 スコアです。したがって、F1=2*(P*R)/(P+R) です。詳しくはこちらをご覧ください。
各クラスのこれらの値を計算し、分類タスクでどれだけうまく行っているかを確認できます.ネガティブクラスに対してそれを計算したい場合は、真のポジティブな例ではなく真のネガティブな例を計算すると言ったようになります. . 真陽性とは、単に対象のクラスに正しく分類されたことを意味することに注意してください。クラスの値とは関係ありません。
最後に、両方のクラスの精度、再現率、および f1 を計算し、それらの平均を取ることもできます。最終的には、分類器のパフォーマンスをどのように判断したいかによって決まります。負のインスタンスを正確に分類することがより重要な場合は、負のインスタンスの精度を高めることに集中する必要があります (もちろん、他のクラスを台無しにしないでください!) 同じことがリコールにも当てはまります。
于 2015-05-07T07:46:50.490 に答える