0

Weka を使用して、バイナリの結果がわかっているトレーニング データを使用してロジスティック回帰を実行しています。パフォーマンスはかなり良好で、約 80% のインスタンスを正しく分類しています。結果が不明な現在のデータを使用したデータセットもあります。現在のデータと出力予測を使用してモデルを実行すると、各インスタンスが [はい] または [いいえ] に分類され、エラーと確率分布項 (エラー + 確率分布 = 1) が提供されます。これらの結果を理解するのに苦労しています。誰かが私がそれらをどのように解釈するべきかについて私を助けることができますか? モデルは、確率分布が 0.5 未満の場合にのみ「はい」と推測することに気付きました。これは、結果がイエスである 1 確率分布としてこれを読むべきだということですか?

4

1 に答える 1

1

クラスの確率は常に合計が 1 になる必要があります。P(Yes)=40%、P(No)=20% で、YesNoだけがクラスである場合、欠落している 40% は何になりますか?

また、結果が P(Yes)=60% および P(No)=40% であり、確率ではなく予測を与える場合、すべての選択肢の中で最も確率が高いため、明らかに合理的な選択はYesになります。 . これがベイズ最適決定規則です。( larsmansに感謝)

二項分類問題では、これは P>50% の答えを選択することと同じです。

得られる実際の出力がどのように見えるかを知らなくても、実際に得られる確率は P(No) のように見えます。

于 2013-05-08T10:16:26.290 に答える