0

残念ながら、多項単純ベイズモデルのドキュメントの確率の式のフラグメントの1つの意味を完全に理解することはできません。それは紙についてですナイーブベイズテキスト分類のためのイベントモデルの比較、式#5:

ここに画像の説明を入力してください

問題のある断片はP(|d_i|)-私は完全には理解できません、この確率はどういう意味ですか?それは単にi番目のドキュメントの確率ですか?もしそうなら、なぜそれは|...|操作を含んでいますか?

4

1 に答える 1

1

|d_i|i番目のドキュメントの単語数です。この用語は、正確に単語P(|d_i|)を含むドキュメントを生成する確率です。|d_i|

于 2013-01-03T23:30:15.343 に答える