25

私は以下を使用して文をチャンクしました:

grammar = '''                                                                                                              
    NP:                                                                                                                    
       {<DT>*(<NN.*>|<JJ.*>)*<NN.*>}                                                                                       
     NVN:                                                                                                                  
       {<NP><VB.*><NP>}                                                                                                    
    '''
chunker = nltk.chunk.RegexpParser(grammar)
tree = chunker.parse(tagged)
print tree

結果は次のようになります。

(S
  (NVN
    (NP The_Pigs/NNS)
    are/VBP
    (NP a/DT Bristol-based/JJ punk/NN rock/NN band/NN))
  that/WDT
  formed/VBN
  in/IN
  1977/CD
  ./.)

しかし今、私はそれをナビゲートする方法を理解しようとして立ち往生しています。NVN サブツリーを見つけて、左側の名詞句 ("The_Pigs")、動詞 ("are")、右側の名詞句 ("a Bristol-basedpunk rock band") にアクセスできるようにしたいと考えています。 . それ、どうやったら出来るの?

4

4 に答える 4

19

試す:

ROOT = 'ROOT'
tree = ...
def getNodes(parent):
    for node in parent:
        if type(node) is nltk.Tree:
            if node.label() == ROOT:
                print "======== Sentence ========="
                print "Sentence:", " ".join(node.leaves())
            else:
                print "Label:", node.label()
                print "Leaves:", node.leaves()

            getNodes(node)
        else:
            print "Word:", node

getNodes(tree)
于 2014-03-08T14:10:29.687 に答える
9

もちろん、独自の深さ優先探索を作成することもできます...しかし、より簡単な(より良い)方法があります。すべてのサブツリーをNVMでルート化する場合は、フィルターパラメーターを定義してTreeのサブツリーメソッドを使用します。

>>> print t
(S
    (NVN
        (NP The_Pigs/NNS)
        are/VBP
        (NP a/DT Bristol-based/JJ punk/NN rock/NN band/NN))
    that/WDT
    formed/VBN
    in/IN
    1977/CD
    ./.)
>>> for i in t.subtrees(filter=lambda x: x.node == 'NVN'):
...     print i
... 
(NVN
    (NP The_Pigs/NNS)
    are/VBP
    (NP a/DT Bristol-based/JJ punk/NN rock/NN band/NN))
于 2013-03-04T23:12:35.173 に答える
7

これは、ラベル「NP」を持つすべてのサブツリーを生成するためのコード サンプルです。

def filt(x):
    return x.label()=='NP'

for subtree in t.subtrees(filter =  filt): # Generate all subtrees
    print subtree

兄弟の場合は、メソッドを確認することをお勧めしますParentedTree.left_siblings()

詳細については、ここにいくつかの便利なリンクがあります。

http://www.nltk.org/howto/tree.html # 基本的な使い方と例 http://nbviewer.ipython.org/github/gmonce/nltk_parsing/blob/master/1.%20NLTK%20Syntax%20Trees. ipynb #a notebook playwith これらのメソッド

http://www.nltk.org/_modules/nltk/tree.html #ソース付きのすべての API

于 2014-12-11T03:25:28.150 に答える
5

これを試して:

for a in tree:
        if type(a) is nltk.Tree:
            if a.node == 'NVN': # This climbs into your NVN tree
                for b in a:
                    if type(b) is nltk.Tree and b.node == 'NP':
                        print b.leaves() # This outputs your "NP"
                    else:
                        print b # This outputs your "VB.*"

これは次のように出力されます。

[('The_Pigs', 'NNS')]

('are', 'VBP')

[('a', 'DT'), ('ブリストルベース', 'JJ'), ('パンク', 'NN'), ('ロック', 'NN'), ('バンド', 'NN ')]

于 2013-02-13T22:26:23.293 に答える