ここで複数のソリューションを試しましたが、一部のコードは削除されていますが、複数の句読点では機能していないようです。"[ または ', このコード:
regex = re.compile('[%s]' % re.escape(string.punctuation))
for i in words:
while regex.match(i):
regex.sub('', i)
私が得たもの:
Python で文字列から句読点を取り除く最良の方法は良かったのですが、それでも二重句読点で問題が発生します。複数の句読点を削除するために各単語を繰り返し処理することを期待してループを追加しましWhile
たが、それは機能しないようで、最初の項目 "[ でスタックして終了しません
私も気づいていないという明らかな部分が欠けているだけですか?
冗長性を追加してリストを二重にループすることで問題を解決しました。かなり大きなセットがあるため、これには非常に長い時間がかかります(数分にもなります)
私はPython 2.7を使用しています