3

私は単語レベルの言語モデルを lingpipe で動作させようとしています。私が遭遇したすべての例とチュートリアルは、character-n-gram モデルを示しています。lingpipe を使用して単語レベルのモデルをトレーニングし、そのモデルを使用して他のドキュメントでテストするにはどうすればよいですか?

さらに、TokenizedLM はシリアル化できないことに気付きました。毎回再トレーニングを行うことなく、保存して後でロードする方法はありませんか?

最後に、自分でコーディングせずにこれを行うことができる他のフレームワーク/ツールはありますか?

4

1 に答える 1

0

Java についてはわかりませんが、そのプログラミング言語に縛られていない場合は、Python NLTKがあり、トークナイザーngram-modelsと他の多くのものがあります。入門書として、概要を把握するために使用できるもあります。

于 2011-11-07T20:34:15.730 に答える