stanford-nlp - スレッドでスタンフォードパーサーを使用する方法

Question

こんにちは私はスタンフォードパーサーのスレッドを使用したいのですが、スレッドプールでそれを行う方法がわかりません。私はすべてのスレッドがこれを行うことを望んでいます：

LexicalizedParser.apply（Object in）

しかし、lp = new LexicalizedParser（ "englishPCFG.ser.gz"）;をロードするため、LexicalizedParserの新しいオブジェクトを常に作成したくありません。オブジェクトごとに2秒かかります。私に何ができる？

ありがとう！

score 2 · Accepted Answer

遅すぎると思いますが、スレッドセーフバージョンがあります: http://nlp.stanford.edu/software/lex-parser.shtml

score 1 · Accepted Answer

ThreadLocalを使用できます。これにより、スレッドごとにパーサーのインスタンスを 1 つ保持できます。したがって、作成されたパーサーのインスタンスが複数のスレッドから使用されることはありません。

通常、使用している CPU * コアよりも多くのインスタンスを作成するべきではありません。

私にとっては、4 ～ 5 個のインスタンスです (クアッドコアでハイパースレッディングを無効にした場合)。

PS StanfordNLP とは関係ありません。貧弱なクラスの実装に静的フィールドが含まれていて、それらをスレッドセーフでない方法で変更することがあります。このような実装の一般的な安全な並列化アプローチは次のようになります。

2 に答える 2