予測誤差メトリックとしてのMAPEとWMAPEには、いくつかの利点があることを私は知っています。しかし、ギャップは何ですか?誰かが言う:
MAPEの場合: 「ボリュームが非常に小さいかゼロの組み合わせでは、結果に大きな偏りが生じる可能性があります」 そしてWMAPEの場合: 「重みが大きい組み合わせは、結果を歪める可能性があります」
理解できませんが、2つの指標の弱点について2つのステートメントを説明できる人はいますか?ありがとう。
予測誤差メトリックとしてのMAPEとWMAPEには、いくつかの利点があることを私は知っています。しかし、ギャップは何ですか?誰かが言う:
MAPEの場合: 「ボリュームが非常に小さいかゼロの組み合わせでは、結果に大きな偏りが生じる可能性があります」 そしてWMAPEの場合: 「重みが大きい組み合わせは、結果を歪める可能性があります」
理解できませんが、2つの指標の弱点について2つのステートメントを説明できる人はいますか?ありがとう。
MAPE、平均絶対パーセント誤差 [1] について、実際の値をAで、予測値をPで表すとします。時間 1 から n までの一連のデータがある場合、
MAPE = 100/n * ( Sum of |(A(t) - P(t))/A(t)| ), for t in 1..n
where A(t) is the actual value at time t, P(t) is the predicted value at time t.
A(t) は分母にあるため、A(t) が非常に小さいかゼロに近い場合は常に、その除算はゼロで割ったもののようになり、絶対パーセント誤差に非常に大きな変化が生じます。このような大きな変更の組み合わせは、確かに結果に大きな偏りを引き起こします。
WMAPE の場合、加重平均絶対パーセント誤差、
Sum of |(A(t) - P(t))/A(t)| * W(t)
WMPAE = -------------------------------------, for t in 1..n
Sum of W(t)
where W(t) is the weight you associate with the prediction at time t.
これは加重測定であるため、MAPE と同じ問題 (ボリュームが非常に小さいかゼロであるために過度に歪むなど) はありません。
ただし、重み係数は、各予測に付けたい主観的な重要性を示します [2]。
たとえば、リリース日を考慮して、重みが高いほど、より新しいデータに重点を置くように重みを割り当てることができます。この場合、MAE が妥当なしきい値を下回っていても、この特定の機能を分析すると、システムのパフォーマンスが不十分である可能性があることがわかります。
このように、最近のデータを好むと結果が歪められます。
[1] http://en.wikipedia.org/wiki/Mean_absolute_percentage_error
[2] http://ir.ii.uam.es/rue2012/papers/rue2012-cleger-tamayo.pdf
別のエラー メトリックもあります。
WAPE = 100/n * Sum(|(A(t) - P(t)|)/sum(A(t)), for t in 1..n
where A(t) is the actual value at time t, P(t) is the predicted value at time t.
大きな歪みには敏感ではありません。