次のテキストがあります:sherlock.txt そして、その中のすべての単語のリストを作成したいと思います(句読点は単語の一部であるため、「glad。」などの区切り要素ではありません)。私がしたことは次のとおりでした:
>>> def wordlist(text):
... input= open(text,'r')
... data= input.read()
... input.close()
... data=data.replace('\n',' ')
... data=data.replace(chr(13),' ')
... data=data.replace(chr(9),' ')
... data=data.split(' ')
... while '' in data:
... data.remove('')
... return data
問題は、単語のリストを返すことですが、約1時間かかります。そうするために7秒。これを行うためのより速い方法はありますか?ここではwhileループが問題であることを知っています。