現在、次のコマンドを使用してアラビア語のテキストを解析しています。
java -mx1500m edu.stanford.nlp.parser.lexparser.LexicalizedParser \
-cp "$scriptdir/*:" -sentences newline -outputFormat "penn,wordsAndTags" \
edu/stanford/nlp/models/lexparser/arabicFactored.ser.gz $FILE
これにより、トークン、タグ、および解析ツリーが出力され、さらに、この出力と同様の処理速度に関する全体的な概要が出力されます。
Parsed 280 words in 10 sentences (1.95 wds/sec; 0.07 sents/sec).
文ごとの処理時間の出力をトリガーするオプションまたはコマンド ライン スイッチはありますか? または、それを自分でコードに追加する必要がありますか?
FAQにもスタンフォードNLPのWebサイトにもそのようなオプションは見つかりませんでしたので、誰かがこの問題について明確にしてくれれば幸いです.