java - 単語レベルの言語モデルに Lingpipe を使用する

Question

私は単語レベルの言語モデルを lingpipe で動作させようとしています。私が遭遇したすべての例とチュートリアルは、character-n-gram モデルを示しています。lingpipe を使用して単語レベルのモデルをトレーニングし、そのモデルを使用して他のドキュメントでテストするにはどうすればよいですか?

さらに、TokenizedLM はシリアル化できないことに気付きました。毎回再トレーニングを行うことなく、保存して後でロードする方法はありませんか?

最後に、自分でコーディングせずにこれを行うことができる他のフレームワーク/ツールはありますか?

score 0 · Accepted Answer

Java についてはわかりませんが、そのプログラミング言語に縛られていない場合は、Python NLTKがあり、トークナイザーとngram-modelsと他の多くのものがあります。入門書として、概要を把握するために使用できる本もあります。

java - 単語レベルの言語モデルに Lingpipe を使用する

1 に答える 1

Related

Reference