4

tokenize input file in pythonは python の新しいユーザーです。

正規表現に関するいくつかのことを読みましたが、まだ混乱しているため、同じリンクまたはコードの概要を提案してください。

4

2 に答える 2

12

次のようなことを試してください:

import nltk
file_content = open("myfile.txt").read()
tokens = nltk.word_tokenize(file_content)
print tokens

NLTK チュートリアルには、わかりやすい例がたくさんあります: https://www.nltk.org/book/ch03.html

于 2012-10-03T07:37:57.357 に答える