2

Javaを使用してすべてのnnタグをフレーズタグに結合する方法

nsubj(martyrdom-4, Today-1)
cop(martyrdom-4, is-2)
det(martyrdom-4, the-3)
root(ROOT-0, martyrdom-4)
nn(Mukherjee-7, Dr-6)
prep_of(martyrdom-4, Mukherjee-7)
det(founder-9, the-8)
dep(tribute-17, founder-9)

prep_of(founder-9, Jan-11)
nn(body-15, Sangh-12)
nn(body-15, BJP-13)
nn(body-15, parent-14)
dep(tribute-17, body-15)
poss(tribute-17, My-16)
dep(martyrdom-4, tribute-17)
prep_to(tribute-17, him-19)

名詞句を取得したい:

prep_of(founder-9,Jan-11)
nn(body-15, Sangh-12)
nn(body-15, BJP-13)
nn(body-15, parent-14)

出力は次のようになります---------->jansangh BJP parent

4

1 に答える 1

1

これは、Stanford Parser からの依存関係チェーンの出力だと思います。はいの場合、文の解析済みツリーに名詞句 (NP ノード) が既にあるはずです。解析ツリーから最下位レベルの NP ノードを抽出して、必要な名詞句を取得できます。たとえば、「今日は Jan Sangh BJP の創設者である Mukherjee 博士の殉教です。 」という文の場合、構文木は次のようになります。

(ROOT
  (S
    (NP (NNP Today))
    (VP (VBZ is)
      (NP
        (NP (DT the) (NN martyrdom))
        (PP (IN of)
          (NP
            (NP (NNP Dr.) (NNP Mukherjee))
            (, ,)
            (NP
              (NP (NN founder))
              (PP (IN of)
                (NP (NNP Jan) (NNP Sangh) (NNP BJP))))))))
    (. .)))

このツリーでは、固有名詞 (NNP) を含む最下位レベルの NP によって、必要な名詞句のほとんど (必要な名前付きエンティティーではないものすべて) が得られます。この場合、出力は次のようになります。

(NP (NNP Today))
(NP (NNP Dr.) (NNP Mukherjee))
(NP (NNP Jan) (NNP Sangh) (NNP BJP))
于 2012-08-25T23:51:49.060 に答える