weka - パフォーマンス評価、エラーまたは精度の最良の基準は?

Question

Weka を使用したアワビデータセットの ANN と KNN。

ANN の結果正しく分類されたインスタンス 3183 76.203 % 誤って分類されたインスタンス 994 23.797 % 平均絶対誤差 0.214 二乗平均平方根誤差 0.3349 相対絶対誤差 58.6486 %

KNNの結果| 正しく分類されたインスタンス 3211 76.8734 % 誤って分類されたインスタンス 966 23.1266 % 平均絶対誤差 0.2142 二乗平均平方根誤差 0.3361 相対絶対誤差 58.7113 %

KNN は精度が高いですが、ANN はエラーが少ないです。では、2 つのアルゴリズムのうちどちらが優れていると言えますか? 精度と誤差のどちらがより望ましい基準ですか?私が理解したのは、精度が高いほど誤差が減少するということです。しかし、ここでの結果は正反対です。なぜそうなのか?

score 1 · Accepted Answer

答えは、問題を分類 (使用するアルゴリズムによって提案されている) として扱うか、回帰として扱うかによって異なります。分類の問題である場合は、正しく分類された/正しく分類されていないインスタンスの割合のみを考慮する必要があります。それ以外の場合、エラー。

説明すると、正しく分類されたインスタンスの割合は、予測が正確かどうかのみを考慮します。つまり、1 ではなく 2 を予測することは、10000 を予測するのと同じくらい間違っています。クラス間の差の大きさの概念。一方、回帰では、連続量を予測し、差の大きさが重要になります。つまり、実際の値が 1 で予測が 2 の場合、モデルは予測が 10000 の場合よりもはるかに優れています。

このようにして、より悪いエラーまたは氷の逆でより良い精度を得ることができます. 何が起こるかというと、全体的にはより正確な予測が得られますが、間違っている予測はさらに外れています。

実際に使用するパフォーマンスの尺度は、特定のアプリケーションによって異なります。正しいクラスが予測されるかどうか、または正しい予測までの距離も気にしますか? 後者の場合は、分類モデルの代わりに回帰を使用することをお勧めします。

weka - パフォーマンス評価、エラーまたは精度の最良の基準は?

1 に答える 1

Related

Reference