次の関数を使用して、Pythonで英数字以外の特殊文字を削除する方法を見つけました。
p_nonalphanum = re.compile('\W+')
def removeNonAlphaNum(string):
m = p_nonalphanum.match(string)
if m:
string = string[m.end():]
return string
1/2、3/4 など、数字と見なされるいくつかの特殊文字を保持したいと思います。正規表現を編集するにはどうすればよいですか?
例:「• ½ カップの小麦粉」から「½ カップの小麦粉」