分類器の精度を確認するために使用できる単純ベイジアン分類器の精度は何パーセントですか?
2 に答える
使用できる別のアドバイスを次に示します。情報検索では、F スコアが一般的に使用される評価基準であり、F スコアには 2 つの要素が含まれます。1. 再現率 = tp / (tp + fn) 2. 精度 = tp / (tp+fp)
(tp = 真陽性...など)
F スコア = (2*再現率*精度) / (再現率 + 精度)
ヨハンが言ったように、評価基準は状況によって異なります。たとえば、マルチラベルの問題では、ハミング ロスやランキング ロスも考慮する場合があります。単一ラベルの場合、ほとんどの場合、F スコアが最も人気があると思います。
通常、機械学習では、特異性と感度を比較して、分類器のパフォーマンスにアクセスします。http://en.wikipedia.org/wiki/Sensitivity_and_specificity
通常、真陽性、偽陽性、真陰性、偽陽性の間でトレードが行われるため、注目している特定のアプリケーションで何がより重要かを判断することが重要です。
これを相互検証と組み合わせて、場合によっては決定変数をランダム化したデータセットでの予測により、分類器がどれほど優れているかがわかります。
予測子のパフォーマンスに単純な答えなどないことに注意してください。たとえば、99 個のサンプルがクラス A であり、そのうちの 1 個がクラス B であるデータ セットを分類するとします。すべてのサンプルを A として分類する分類器のビルドは、99% の感度を持ちますが、それでも感度はありません。非常に便利です。