4

私はテキスト分類のためにPythonでナイーブベイズ分類器を使用しています。Python NLTKで見えない単語の確率がゼロになるのを避けるための平滑化方法はありますか?前もって感謝します!

4

1 に答える 1

2

すべての単語を低頻度 (特に 1) に置き換えてから<unseen>、このデータで分類器をトレーニングすることをお勧めします。分類するため<unseen>に、トレーニング データにない単語の場合は、モデルにクエリを実行する必要があります。

于 2012-11-15T12:51:09.617 に答える