小文字とそれに続く大文字を一致させたいとすると、次のようなことができます。
re.compile(r"[a-z][A-Z]")
ここで、Unicode文字列に対して同じことを実行します。つまり、「aÅ」や「yÜ」などに一致させます。
試してみました
re.compile(r"[a-z][A-Z]", re.UNICODE)
しかし、それは機能しません。
手がかりはありますか?
小文字とそれに続く大文字を一致させたいとすると、次のようなことができます。
re.compile(r"[a-z][A-Z]")
ここで、Unicode文字列に対して同じことを実行します。つまり、「aÅ」や「yÜ」などに一致させます。
試してみました
re.compile(r"[a-z][A-Z]", re.UNICODE)
しかし、それは機能しません。
手がかりはありますか?
\p{Lu}
現在の実装はやのようなUnicodeプロパティショートカットをサポートしていないため、これをPython正規表現で行うのは困難です\p{Ll}
。
[A-Za-z]
もちろん、Unicodeオプションが設定されているかどうかに関係なく、ASCII文字にのみ一致します。
したがって、re
モジュールが更新されるまで(または現在開発中のregex
パッケージをインストールするまで)、プログラムで実行するか(文字列を繰り返し処理し、文字に対してchar.islower()
/char.isupper()
を実行する)、すべてのユニコードコードポイントを手動で指定する必要がありますが、おそらくそうではありません。努力する価値があります...