2 に答える
5
「アンダースコア以外の\w」と書きたい場合は、否定文字クラスを使用して行うことができます。
[^\W_]
于 2012-03-22T22:05:43.450 に答える
0
バックリーが指摘したように、「Unicode プロパティに一致する Python 正規表現」は、Pythonで正規表現 + Unicode を使用するためのいくつかの代替手段を示しています。必要なものが英数字、 英数字 + アンダースコア、または文字のみの場合は、Mark Byers の提案に固執する方が簡単かもしれません ( [^\W_]
、\w
および[^\W\d_]
それぞれ、re.UNICODE
アクティブ;編集:順序が間違っています...)。
それ以外の場合は、IRI パーツとして有効な文字クラスを調べて、Unicode 文字クラスをサポートする正規表現エンジンを使用するか、純粋な Python ソリューションが必要な場合は、その質問への回答で提供したコードをお勧めします(または同様の解決策)。
于 2012-03-22T22:14:14.607 に答える