与えられた文字列:
c = 'A problem. She said: "I don\'t know about it."'
そしてそれをトークン化する試み:
>>> for sindex,sentence in enumerate(sent_tokenize(c)):
... print str(sindex)+": "+sentence
...
0: A problem.
1: She said: "I don't know about it.
2: "
>>>
NLTK がセンテンス 2 の最後の引用符を独自のセンテンス 3 に入れるのはなぜですか? この動作を修正する方法はありますか?