イベントの確率(スポーツゲームの結果ですが、それも重要ではありません)を推定するために、ヒューリスティック(ANNですが、それは重要ではありません)を作成しました。いくつかの入力が与えられると、このヒューリスティックはイベントの確率を教えてくれます。次のようなもの:これらの入力を考えると、チームBは65%の確率で勝ちます。
私は現在結果(以前にプレイしたゲーム)の入力データの大規模なセットを持っています。推定量の精度を評価するためにどの式/メトリックを使用できますか。
私が見ている問題は、推定者がイベントの確率が20%であり、実際にイベントが発生していると言った場合です。見積もりが正しいか間違っているかを判断する方法がありません。多分それは間違っていて、イベントはそれよりも可能性が高かった。たぶんそれは正しいです、イベントは約20%の確率で発生し、実際に発生しました。おそらくそれは間違っています。イベントが発生する可能性は非常に低く、たとえば1000分の1ですが、今回はたまたま発生しました。
幸いなことに、私はこれらの実際のテストデータをたくさん持っているので、おそらくそれらを使用してヒューリスティックを修飾する方法があります。
誰かアイデアがありますか?