1

Penn Treebank 形式は、名詞句の内部構造に注釈を付けません。

(NP (JJ crude) (NN oil) (NNS prices))

また

(NP
    (NP (DT the) (JJ big) (JJ blue) (NN house))
    (SBAR
      (WHNP (WDT that))
      (S
        (VP (VBD was)
          (VP (VBN built)
            (PP (IN near)
              (NP (DT the) (NN river)))))))

頭(価格と家)を抽出したいと思います。これを行うことができるツールを知っていますか?

4

3 に答える 3

9

Michael Collins の論文(付録 A) には、Penn Treebank のヘッド ファインディング ルールが含まれています。ただし、これは最も簡単な作業ではないため、完璧とは言えません。

Penn Treebank の NP 構造に関する David Vadas と James Curran の研究も関連している可能性があります。

于 2012-04-24T13:29:40.240 に答える
1

また、Dan Bikel の論文で英語の頭を見つけるルールを見つけることができます (ソース コードが必要な場合は、彼のホームページのパーサー ソフトウェアで見つけることができます)。

于 2012-07-19T08:12:18.730 に答える
1

aab が示唆したように、単純な決定論的な頭部発見規則は非常にうまく機能します (同様のアプローチについては、Magerman または Charniak 頭部発見規則への参照も参照してください)。

また、構成ツリーから依存関係構造を抽出することも検討してください。スタンフォード ツールセットはこれを非常にうまく行っています。http://nlp.stanford.edu/software/stanford-dependencies.shtmlを参照してください。

于 2012-04-25T03:42:26.957 に答える