nlp - NLP アプリケーションに言語モデルを格納する最も効率的な方法は何ですか?

翻译自：https://stackoverflow.com/questions/29915993 2015-04-28T09:49:54.913

1169 次

2

通常、言語モデル (N-gram モデルなど) をどのように保存および更新しますか? これらのモデルをデータベースに格納する最も効率的な方法はどのような構造ですか?

2 に答える 2

1

音声認識やその他のアプリケーションでは、n グラムモデルを有限状態変換器として表現するのが一般的です。FST が最も効率的なストレージ構造かどうかはわかりませんが、FST を音声認識モデルの他の部分と組み合わせる非常に単純な (そして数学的にクリーンな) 方法があります。

言語モデルの構築、プルーニング、評価などについては、 OpenFSTライブラリとOpenGRMツール (OpenFST 上に構築) を参照してください。Mohri et al., 2002は、OpenFST および OpenGRM サイトからリンクされている他の論文とともに、良い入門書です。 .

于 2015-04-29T16:08:32.820 に答える