0

次のコードがあります

import nltk
from nltk.corpus.reader import TaggedCorpusReader

corpus_root = 'C:/Python27'
reader = TaggedCorpusReader(corpus_root, 'test.txt')
print reader.words()
print reader.tagged_words()

問題は、結果の各単語に「なし」という値が表示されることです..

[('And', 'None'), ('now', 'None')..

そして、私がこのコードを持っているとき

import nltk
text = nltk.word_tokenize("And now for something completely different")
nltk.pos_tag(text)

結果は正しい...

[('And', 'CC'), ('now', 'RB'), ('for', 'IN'), ('something', 'NN'), ('completely', 'RB'), ('different', 'JJ')]

何がうまくいかないのですか??

4

0 に答える 0