java - LingPipe 辞書サイズ

Question

LingPipe DictionaryChunker の例に基づいてテストプログラムを作成しました。ファイルから辞書の値を MapDictionary に読み込んでいます。ファイルが 100,000 エントリを超えると、パーサーはガベージを返し始めます。

10k 行 (末尾 -10000 nameList.txt > shortNameList.txt)

TEXT=今こそ、すべての善良な人々が国を支援する時です。

チャンカー。すべての一致 = false 大文字と小文字を区別 = false フレーズ = |Zoe Rogers| start=69 end=79 type= PLAYER スコア=1.0

100k 行 (末尾 -100000 nameList.txt > shortNameList.txt)

TEXT=今こそ、すべての善良な人々が国を支援する時です。

MapDictionary を作成するためのより良いオプションはありますか?

VM のメモリの制約を調整しましたが、役に立たないようです。

何か案は？

score 0 · Accepted Answer

MapDictionary の任意の値を null にできるようにすると、チャンカーが壊れることがわかります。値が空白の行を削除すると、チャンカーは正常に動作します。

1 に答える 1