この質問 ( Python で文字列から句読点を取り除く最良の方法) は、個々の文字列から句読点を取り除くことを扱います。ただし、入力ファイルからテキストを読み取ることを望んでいますが、句読点を終了せずにすべての文字列の 1 つのコピーのみを出力します。私はこのようなことを始めました:
f = open('#file name ...', 'a+')
for x in set(f.read().split()):
print x
しかし、問題は、入力ファイルにたとえば次の行がある場合です。
This is not is, clearly is: weird
「is」の 3 つの異なるケースを異なる方法で扱いますが、句読点を無視して、「is」を 3 回ではなく 1 回だけ出力したいと考えています。任意の種類の終了句読点を削除して、結果の文字列をセットに入れるにはどうすればよいですか?
助けてくれてありがとう。(私はPythonに本当に慣れていません。)