NTLK文法と解析アルゴリズムは非常に使いやすいと思われるため、使用しようとしています。ただし、次のような英数字の文字列を適切に一致させる方法が見つかりません。
import nltk
grammar = nltk.parse_cfg ("""
# Is this possible?
TEXT -> \w*
""")
parser = nltk.RecursiveDescentParser(grammar)
print parser.parse("foo")
これを達成する簡単な方法はありますか?