Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
私はテキスト分類のためにPythonでナイーブベイズ分類器を使用しています。Python NLTKで見えない単語の確率がゼロになるのを避けるための平滑化方法はありますか?前もって感謝します!
すべての単語を低頻度 (特に 1) に置き換えてから<unseen>、このデータで分類器をトレーニングすることをお勧めします。分類するため<unseen>に、トレーニング データにない単語の場合は、モデルにクエリを実行する必要があります。
<unseen>