私は言語モデリングに不慣れ で、大きなテキスト ファイル (~7gb.) からkenlm (またはthis ) を使用して 3grams 言語モデルを作成します。言語モデルからバイナリ ファイルを作成し、Python で次のように呼び出します。
import kenlm
model = kenlm.LanguageModel(<my .klm file>)
model.score(<my sentence>)
結果として負の数が得られます.スコアリングの文を変更すると、結果は負のままですが、変更されます.大きなテキストファイルの文の1つを正確に指定しますが、悪い負の数が得られます(テキストファイルにない文)否定的な結果が何を意味するのか、それを肯定的で通常の結果に変換して、いくつかの文の間で最も正しい文を選択するにはどうすればよいのかわかりません。