単純なベイズ テキスト分類手法では、通常、トレーニング データ内の単語をカウントし、ドキュメントが単語の文字列である p(label | document) を計算しますか?
テキスト分類の場合、ラベルを予測するために P(label | word1、word2 など) を直接計算できないのはなぜですか? (つまり、なぜベイズ定理を使う必要があるのですか)
ドキュメントがあれば、完全なデータがあります... p(label and w1 and w2 ) / p(w1 and w2) を直接計算できるはずですか?
トレーニング セットがグラウンド トゥルースではないことに気付きました。ベイズの定理でそれを計算すれば、その問題は解決しますか? もしそうなら、どのように?数学がどのように機能するかを示すことができますか?