2
4

2 に答える 2

5

「アンダースコア以外の\w」と書きたい場合は、否定文字クラスを使用して行うことができます。

[^\W_]
于 2012-03-22T22:05:43.450 に答える
0

バックリーが指摘したように、「Unicode プロパティに一致する Python 正規表現」は、Pythonで正規表現 + Unicode を使用するためのいくつかの代替手段を示しています。必要なものが英数字英数字 + アンダースコア、または文字のみの場合は、Mark Byers の提案に固執する方が簡単かもしれません ( [^\W_]\wおよび[^\W\d_]それぞれ、re.UNICODEアクティブ;編集:順序が間違っています...)。

それ以外の場合は、IRI パーツとして有効な文字クラスを調べて、Unicode 文字クラスをサポートする正規表現エンジンを使用するか、純粋な Python ソリューションが必要な場合は、その質問への回答で提供したコードをお勧めします(または同様の解決策)。

于 2012-03-22T22:14:14.607 に答える