python - Python NLTK : スタンフォード依存関係の解析結果から字句ヘッド項目を抽出する

翻译自：https://stackoverflow.com/questions/34587293 2016-01-04T08:37:25.860

828 次

私は文を持っていて、語彙の見出し項目を抽出したいのですが、スタンフォード NLP ライブラリを使用して依存関係の解析を行うことができました。

文で主な頭の頭を抽出するにはどうすればよいですか?

文の場合Download and share this tool、頭はになりますDownload。

私は次のことを試しました：

 def get_head_word(text):
     standepparse=StanfordDependencyParser(path_to_jar='/home/stanford_resource/stanford-parser-full-2014-06-16/stanford-parser.jar',path_to_models_jar='/home/stanford_resource/stanford-parser-full-2014-06-16/stanford-parser-3.4-models.jar',model_path='/home/stanford_resource/stanford-parser-full-2014-06-16/stanford-parser-3.4-models/edu/stanford/nlp/models/lexparser/englishPCFG.ser.gz')
     parsetree=standepparse.raw_parse(text)
     p_tree=list(parsetree)[0]
     print p_tree.to_dot()

 text = 'Download and share this tool'
 get_head_word(text)


output:

digraph G{
edge [dir=forward]
node [shape=plaintext]

0 [label="0 (None)"]
0 -> 1 [label="root"]
1 [label="1 (Download)"]
1 -> 2 [label="cc"]
1 -> 3 [label="conj"]
1 -> 5 [label="dobj"]
2 [label="2 (and)"]
3 [label="3 (share)"]
4 [label="4 (this)"]
5 [label="5 (software)"]
5 -> 4 [label="det"]
}

python - Python NLTK : スタンフォード依存関係の解析結果から字句ヘッド項目を抽出する

1 に答える 1

Related

Reference