入力テキストから n-gram 確率を自動的に生成し、1 つまたは複数の平滑化アルゴリズムも自動的に適用できる、ある種のパッケージまたはモジュール (できれば Python または Perl ですが、他のものも同様です) を見つけたいと思います。
つまり、NLTKNgramModel
クラスのようなものを探しています。これは私の目的には使用できません。これは、平滑化関数にバグがあり、前に見たことのない単語の可能性を尋ねるとチョークするからです。
私は NLTK の開発フォーラムを読んだことがありますが、今のところ進展はないようです。
代替案はありますか?