スタンフォードのCoreNLPシステムによって前処理された文のコーパスがあります。それが提供するものの 1 つは、文の解析ツリー (Constituency ベース) です。(ツリーのように) 描画されたときの解析ツリーは理解できますが、この形式でそれを読み取る方法がわかりません。
例えば:
(ROOT
(FRAG
(NP (NN sent28))
(: :)
(S
(NP (NNP Rome))
(VP (VBZ is)
(PP (IN in)
(NP
(NP (NNP Lazio) (NN province))
(CC and)
(NP
(NP (NNP Naples))
(PP (IN in)
(NP (NNP Campania))))))))
(. .)))
元の文は次のとおりです。
sent28: Rome is in Lazio province and Naples in Campania .
このツリーをどのように読むべきですか、またはそれを適切に実行するコード (Python で) はありますか? ありがとう。