5

NB 分類子を使用して、教師あり機械学習アルゴリズムで精度と再現率を計算する方法について本当に混乱しています

たとえば、
1) 2 つのクラス A、Bがある
2) 10000 個のドキュメントがあり、そのうち 2000 個がトレーニング サンプル セットに使用されます (クラス A=1000、クラス B=1000)
3)上記のトレーニング サンプル セットに基づいて残りを分類しますNB 分類器を使用した 8000 文書
4)分類後、5000 文書がクラス A に、3000 文書がクラス B に分類されます
5)さて、Precision と Recall をどのように計算しますか?

私を助けてください..

ありがとう

4

2 に答える 2

18

こんにちは、結果を 4 つのグループに分割する必要があります -
真のクラス A (TA) - 正しくクラス A に分類される
偽のクラス A (FA) - 誤ってクラス A に分類される
真のクラス B (TB) - 正しくクラス B に分類される
偽のクラス B ( FB) - クラス B に誤って分類される

精度 = TA / (TA + FA)
再現率 = TA / (TA + FB)

精度と F 値も必要になる場合があります。

精度 = (TA + TB) / (TA + TB + FA + FB)
f 値 = 2 * ((精度 * 再現率)/(精度 + 再現率))

詳細はこちら:
http://en.wikipedia.org/wiki/Precision_and_recall#Definition_.28classification_context.29

于 2012-12-08T12:18:25.460 に答える