同じスタンフォード CoreNLP (3.8.0) パイプラインを使用して分析している次の 2 つの文があります。
私が理解できないのは、文が文法的に同一であるにもかかわらず、依存関係パーサーが異なるツリーを構築する理由です。一貫性を強制する方法はありますか?
例 1
S1: “Admin Account” means all or any account created in connection with this website.
S2: “Admin Account” means all or any user created in connection with this website.
S3: “Admin Account” means all or any cat created in connection with this website.
S4: “Admin Account” means all or any dog created in connection with this website.
これらは次のように解析されます。
例 2
これは、名義句を導入する同じ文のバリエーションを使用した別の例です。
これがcorenlpサーバーの実行方法です
java -mx20g -cp "*" edu.stanford.nlp.pipeline.StanfordCoreNLPServer -port 9001 -timeout 35000 -parse.model edu/stanford/nlp/models/srparser/englishSR.beam.ser.gz -tokenize.language en -tagger edu/stanford/nlp/models/pos-tagger/english-bidirectional/english-bidirectional-distsim.tagger -depparse.model edu/stanford/nlp/models/parser/nndep/english_SD.gz