オンラインでフォローしているこの例と少し混乱しています。質問に入る前に、何か間違っている場合は修正してください。私はベイズの定理がこれであることを知っています:
P(A│B)= P(B│A) * P(A)
----------
P(B)
私が見ている例では、分類はテキスト文書で行われています。テキストドキュメントはすべて「テロ」または「娯楽」のいずれかであるため、次のようになります。
Prior probability for either, i.e. P(A) = 0.5
次のような単語の頻度を持つ 6 つのドキュメントがあります。
この例では、ラプラス推定を適用して、各クラスに関連してこれらの単語の頻度を分類します。
したがって、私の理解では、これらの各数値は P(B|A)、つまり特定のクラス (テロリズムまたはエンターテイメント) でその単語が出現する確率を表しています。
この内訳で新しいドキュメントが届きます。
この例では、次のようにして、この新しいテキスト ドキュメントがテロに関連する確率を計算します。
P(Terrorism | W) = P(Terrorism) x P(kill | Terrorism) x P(bomb | Terrorism) x P(kidnap | Terrorism) x P(music | Terrorism) x P(movie | Terrorism) x P(TV | Terrorism)
これは次のようになります。
0.5 x 0.2380 x 0.1904 x 0.3333 x 0.0476 x 0.0952 x 0.0952
繰り返しますが、今まで私はフォローしていると思います。P(テロリズム | W) は、P (A|B)、P(テロリズム) = P(A) = 0.5、および P(B|A) = 上記の表の「テロリズム」のすべての結果を掛け合わせたものです。
しかし、この新しいドキュメントに適用するために、この例では、上記の P(B|A) のそれぞれを新しい周波数のべき乗で計算します。したがって、上記の計算は次のようになります。
0.5 x 0.2380^2 x 0.1904^1 x 0.3333^2 x 0.0476^0 x 0.0952^0 x 0.0952^1
そこから、彼らは私が得たいくつかの合計を計算し、答えを見つけます。私の質問は:
新しい周波数を電力として現在の P(B|A) に適用するとは、式のどこに記載されていますか?
これは私が知らない単なる統計的なものですか?これは普遍的なものですか、それとも特定の方法の例にすぎませんか? 私が見つけたすべての例は、わずかに異なるキーワードと用語を使用して、わずかに異なっていて、少し混乱しているので質問しています!