コマンドラインからスタンフォードパーサーを使用しています:
java -mx1500m -cp stanford-parser.jar;stanford-parser-models.jar edu.stanford.nlp.parser.lexparser.LexicalizedParser -outputFormat "penn" edu/stanford/nlp/models/lexparser/englishPCFG.ser.gz {file}
27 語の 1 つの文に対してコマンドを実行すると、Java プロセスが 100MB のメモリを消費し、解析に 1.5 秒かかります。148 語の 1 つの文に対してコマンドを実行すると、Java プロセスは 1.5GB のメモリを消費し、解析には 1.5 分かかります。
私が使用しているマシンは、Intel i5 2.53GH を搭載した Windows 7 です。
これらの処理時間は妥当ですか? パーサーの公式のパフォーマンス ベンチマークはありますか?