Pythonはとに一致するものを拡張できますw+
かW+
?リストに文字を追加するにはどうすればよいですか?
なんで?&
いくつかのテキストを調べて、やなどの単語定義に追加したい文字がいくつかあることを見つけますæ
。
単語の定義に追加できない場合、関数に追加するにはどうすればよいですか。
re.findall(r'\w+', txt)
re.findall(r'\W+', txt)
\w
事前定義された文字のセットです。プログラムでの意味を変更することはできません\w
。\w
ただし、構文を使用して、の任意の文字に加えて、必要な他の任意の文字に一致するグループを設定でき[]
ます。したがって、正規表現を次のように変更します
[\w\&æ]+
また
[\W\&æ]+
それぞれ
\w
これは、またはセット内の任意の文字と一致し、\W
&およびæを追加します。regexpalでこれらの式を試してみることができます。
コンパイル済みのパターンで文字グループを使用します。
lower_match_chars = re.compile('[\\w\\&]+')
upper_match_chars = re.compile('[\\W\\&]+')
all_lower_matches = re.findall(lower_match_chars, txt)
all_upper_matches = re.findall(upper_match_chars, txt)