Python NLTK Bookの例をいくつか試してみました。たとえば、第 7 章では、次の例を使用してチンキングについて説明しています。
grammar = r"""
NP:
{<.*>+} # Chunk everything
}<VBD|IN>+{ # Chink sequences of VBD and IN
"""
sentence = [("the", "DT"), ("little", "JJ"), ("yellow", "JJ"),
("dog", "NN"), ("barked", "VBD"), ("at", "IN"), ("the", "DT"), ("cat", "NN")]
cp = nltk.RegexpParser(grammar)
result = cp.parse(sentence)
私によると、これは結果から「barked at」を削除することになっています。しかし、そうではありません。私はpythonとnltkを初めて使用しますが、ここで何が欠けていますか? ここで更新する必要がある明らかなものはありますか? ありがとう..