このコード ブロックがあり、テキスト ファイルを調べて、行ごとに取得し、個別の単語に分割します。これで問題ありませんが、テキスト ファイル内に、「-foo-」や「-foo bar-」など、「-」で始まり「-」で終わる特定の語句があります。現在、コードが「-foo」と「bar-」であるため、それらは分割されています。しかし、なぜこれが起こっているのか理解しています。
私の計画は、「-」で始まって終わるインスタンスを取得し、それらを別のリストに保存してから、ユーザーがそれらのフレーズをそれぞれ新しいものに変更し、それらをリストに戻すことです。特定のフレーズが 2 つの別個の単語である場合、そのフレーズを取得するように指示するにはどうすればよいですか?
def madLibIt(text_file):
listOfWords = [] #creates a word list
for eachLine in text_file: #go through eachLine, and split it into
#seperate words
listOfWords.extend(eachLine.split())
print listOfWords