0

Pythonを使用してnltkを学習しています。POSタグ付けを使用しています。私が知りたいのは、タグの使い方です。たとえば、これは擬似コードです。

words = []
teststr = "George did well in the test."
tokens = nltk.word_tokenize(teststr)
words = nltk.pos_tag(tokens)

私はこのようなことをしたい:

if words[i] == "proper noun":
    #do something

単語が名詞か動詞かその他の品詞かどうかを確認するにはどうすればよいですか。誰かがここで私を助けてくれますか?ありがとう。

4

1 に答える 1

2

pos_tag関数呼び出しの結果を見ると、次のリストが返されます。

[('George', 'NNP'), ('did', 'VBD'), ('well', 'RB'), ('in', 'IN'), ('the', 'DT'), ('test', 'NN'), ('.', '.')]

リストを繰り返し処理して、値が適切な名詞であることに基づいて何かを行う場合は、次のコードが必要になります。

if words[i][1] == 'NNP':
    # do something

NNPは単数形の名詞です。そのリストの各エントリはタプルであり、最初の値が単語で、2番目の値がposです。

于 2013-03-22T23:31:13.683 に答える