1

同じスタンフォード CoreNLP (3.8.0) パイプラインを使用して分析している次の 2 つの文があります。

私が理解できないのは、文が文法的に同一であるにもかかわらず、依存関係パーサーが異なるツリーを構築する理由です。一貫性を強制する方法はありますか?

例 1

S1: “Admin Account” means all or any account created in connection with this website.
S2: “Admin Account” means all or any user created in connection with this website.
S3: “Admin Account” means all or any cat created in connection with this website.
S4: “Admin Account” means all or any dog created in connection with this website.

これらは次のように解析されます。

ここに画像の説明を入力 ここに画像の説明を入力


例 2

これは、名義句を導入する同じ文のバリエーションを使用した別の例です。

ここに画像の説明を入力


これがcorenlpサーバーの実行方法です

java -mx20g -cp "*" edu.stanford.nlp.pipeline.StanfordCoreNLPServer -port 9001 -timeout 35000 -parse.model edu/stanford/nlp/models/srparser/englishSR.beam.ser.gz -tokenize.language en -tagger edu/stanford/nlp/models/pos-tagger/english-bidirectional/english-bidirectional-distsim.tagger -depparse.model edu/stanford/nlp/models/parser/nndep/english_SD.gz
4

1 に答える 1