2

MATLAB (組み込み) で Naive Bayes を使用して、データのクラス ラベル値を予測しました。私のクラス ラベルは、{1,2,3,4,5} の任意の値を持つことができます。私もtestLabelsを持っています。testLabels と predictLabels の差が良いかどうかを測定する方法は?

RMSE を使用しようとしました。しかし、それは私に1.87124の値を与えているようです

この RMSE 値の解釈方法がわかりませんか?

さらに、単純ベイズのマルチクラス結果の評価を行うための標準的な評価方法はありますか?

TPR、FPR、Precision、Accuracyなどを使用できるバイナリラベルクラスを知っています.

4

2 に答える 2

1

マルチクラスの問題は、標準メトリックの一般化によってスコア付けできます。精度は明らかにマルチクラスのケースに適用でき、再現率と精度は各クラスを個別に調べることで一般化できます。2 方向の分類タスクは 5 方向の分類タスクよりもはるかに簡単であるため、2 項問題を見ると誤解を招く可能性があります。

RMSE は適切な指標ではありません。1 ~ 5 のラベルを使用すると、0.74 の RMSE が得られます。ただし、ラベルは任意であるため、クラス ラベルを並べ替えて、同じ決定に対してまったく異なる RMSE を取得できます。

于 2012-12-05T10:38:11.803 に答える
0

さまざまなメトリックを使用できます。多くの場合、精度 (つまり、testLabel が predictLabel と等しい頻度) は良い指標です。

また、タイプ I およびタイプ II のエラーに似たものを測定する、適合率と再現率を調べることもできます。

ただし、このケースに RMSE を適用しても意味がないことは確かです。たとえば、数字の 1、2、3、4、5 の代わりに文字 A、B、C、D、E を使用してデータにラベルを付けるとします。これはまったく同じ問題です (ラベル自体は無意味なので)。は数値にしか適用できないため、計算できません。

于 2012-12-05T17:22:46.560 に答える