文字列から一貫性のない文字を除外しようとしています。
現在私はこれを持っています..Pythonで
name = re.sub('([^a-zA-Z0-9 -\'!$&])',' ', name)
しかし、'()'角かっこ'/'バックスラッシュやフォワードスラッシュなどの文字を含めようとしています。どういうわけかそれは動作しません。どなたか見ていただけませんか。
非正規表現ソリューション
accepted = '''!$*()\/.,>-_=+<:;'"?|'''
allowed = string.digits + string.letters + accepted
filter(allowed.__contains__, name)
これにより、英数字以外の文字列名がフィルター処理され、 acceptedにリストされている文字がフィルター処理されなくなります。
name = re.sub('([^a-zA-Z0-9\[\]\(,\)\+\/ \\-\'!$&])',' ', name)