0

一部のテキストを解析するために parsey mcparseface と syntaxnet を使用しています。構文木とともに単語の位置データを抽出したいと考えています。

現在、出力は次のとおりです。

echo 'Alice brought the pizza to Alice.' | syntaxnet/demo.sh

Input: Alice brought the pizza to Alice .
Parse:
brought VBD ROOT
 +-- ALice NNP nsubj
 +-- pizza NN dobj
 |   +-- the DT det
 +-- to IN prep
 |   +-- Alice NNP pobj
 +-- . . punct

私はそれが必要な方法

Input: Alice brought the pizza to Alice .
Parse:
brought VBD ROOT 2
 +-- Alice NNP nsubj 1
 +-- pizza NN dobj 4
 |   +-- the DT det 3
 +-- to IN prep 5
 |   +-- Alice NNP pobj 6
 +-- . . punct 7

または類似。(これは、同じ単語が多数出現する場合に特に役立ちます。)

ありがとうございました

4

1 に答える 1

2

conll2tree.py を編集できます https://github.com/tensorflow/models/blob/master/syntaxnet/syntaxnet/conll2tree.py

token_strに変更

token_str = ['%s %d %s %s' % (token.word, tind,
           token.tag, token.label)
           for tind,token in enumerate(sentence.token,1)]

するべきです。

于 2016-08-11T04:46:26.977 に答える