1

ユニグラム言語モデルがあり、カウントを滑らかにしたい。唯一の方法でスムージングを追加するか、他のスムージングも使用できますか。N > = 2のNgram用であるため、knesser nayを使用できるとは思いません。あなたが知っている他の平滑化方法はありますか?

ウィッテンベルはいかがですか?

4

1 に答える 1

1

ユニグラムの平滑化には、Good-Turing が最適です ...そして (適用するのは) 簡単です!

http://en.wikipedia.org/wiki/Good%E2%80%93Turing_frequency_estimation

高次の場合は、修正補間された Kneser-Ney が適切な選択です。

于 2011-10-21T08:51:06.033 に答える