次の確率を見つけたい:
P(y=1/n=k; thetha)
として読む:
確率、予測はクラス1であり、単語数= kであり、thethaによってパラメーター化されます。
従来の分類には条件付き確率がありません(右)
P(y = 1; thetha)
どうすればこれを解決できますか?
編集:
たとえば、添付ファイルの数に基づいて、電子メールがスパムであるかどうかを予測したいとします。y=1
スパムを示し、y=0
非スパムにしましょう。
それで、
P(y = 1/num_attachements=0; some attributes)
and so on!!
意味がありますか?