Stanford-NLP と CoreNLP を使用してテキストを分析しようとすると、パフォーマンスが非常に低下します。CNN.com からのドキュメントの処理には約 30 秒かかります。
私が持っているコードは基本的に、次の構成で StanfordCoreNLP の単一のインスタンスを作成します。
アノテーター = tokenize、ssplit、pos、lemma、ner、parse、dcoref sutime.binders = 0
「ner、parse、dcoref」を無効にすると、パフォーマンスが非常に速くなります。セマンティック グラフを取得する必要があるため、パフォーマンスを最適化する方法や、セマンティック グラフを取得して Direct Object、Noun Subject などを取得する別の方法がないか考えていました。