単純ベイズ分類子の実装、特にゼロ カウントの問題とオーバーフィッティングを回避するためのラプラス スムージングの実装に関する確率/統計に関する質問があります。
私が読んだことから、MLE を使用した基本的な NBC 式は次のようになります。
p(C│F_1 ...F_n )=(p(C)p(F_1 |C)...p(F_n |C))/(p(F_1)...p(F_n))
ただし、p(F_i |C) の 1 つが 0 の場合、全体の確率は 0 になります。1 つの解は Lapace Smooth です。
p(F_i│C)~(x_i+k)/(N+kd)
ここで、x_i は F_i がクラス C に出現した回数、N はクラス C が出現した回数、d は F_i が取ることがわかっている個別の値の数です。
私の質問はこれです:
分子の p(C) と分母の p(F_i) に対して何かを行う必要がある場合はどうすればよいでしょうか?