この一連の RegEx の何が問題になっていますか/^[\p{L}\p{N}]+/u
。私の先輩が% openmovedに入ったとき、正規表現はfalseを返します。この形式を受け入れるために必要です
% オープンマインド
100% オープンマインド オープン
マインド 100%
式には何を追加する必要がありますか? ユーザーが%
最初に入力したり、特殊文字を入力したりしても、入力を受け入れるようにします。
この一連の RegEx の何が問題になっていますか/^[\p{L}\p{N}]+/u
。私の先輩が% openmovedに入ったとき、正規表現はfalseを返します。この形式を受け入れるために必要です
% オープンマインド
100% オープンマインド オープン
マインド 100%
式には何を追加する必要がありますか? ユーザーが%
最初に入力したり、特殊文字を入力したりしても、入力を受け入れるようにします。
パーセント記号は記号ではありません\pS
。unipropsで説明され ているように、これは\pP
句読点です。
$ uniprops %
U+0025 ‹%› \N{PERCENT SIGN}
\pP \p{Po}
All Any ASCII Assigned Basic_Latin Common Zyyy Po P Gr_Base Grapheme_Base Graph GrBase Other_Punctuation Punct Pat_Syn Pattern_Syntax PatSyn POSIX_Graph POSIX_Print POSIX_Punct Print Punctuation X_POSIX_Graph X_POSIX_Print X_POSIX_Punct
お気に入りのキャラクターが属する一般的なカテゴリ (およびおそらくスクリプト) に慣れておく必要があります。unicharsを実行した場合の出力例を次に示します。
$ unichars -gs '[\pP\pS]' '\p{Block=Basic_Latin}'
U+0021 ! GC=Po SC=Common EXCLAMATION MARK
U+0022 " GC=Po SC=Common QUOTATION MARK
U+0023 # GC=Po SC=Common NUMBER SIGN
U+0024 $ GC=Sc SC=Common DOLLAR SIGN
U+0025 % GC=Po SC=Common PERCENT SIGN
U+0026 & GC=Po SC=Common AMPERSAND
U+0027 ' GC=Po SC=Common APOSTROPHE
U+0028 ( GC=Ps SC=Common LEFT PARENTHESIS
U+0029 ) GC=Pe SC=Common RIGHT PARENTHESIS
U+002A * GC=Po SC=Common ASTERISK
U+002B + GC=Sm SC=Common PLUS SIGN
U+002C , GC=Po SC=Common COMMA
U+002D - GC=Pd SC=Common HYPHEN-MINUS
U+002E . GC=Po SC=Common FULL STOP
U+002F / GC=Po SC=Common SOLIDUS
U+003A : GC=Po SC=Common COLON
U+003B ; GC=Po SC=Common SEMICOLON
U+003C < GC=Sm SC=Common LESS-THAN SIGN
U+003D = GC=Sm SC=Common EQUALS SIGN
U+003E > GC=Sm SC=Common GREATER-THAN SIGN
U+003F ? GC=Po SC=Common QUESTION MARK
U+0040 @ GC=Po SC=Common COMMERCIAL AT
U+005B [ GC=Ps SC=Common LEFT SQUARE BRACKET
U+005C \ GC=Po SC=Common REVERSE SOLIDUS
U+005D ] GC=Pe SC=Common RIGHT SQUARE BRACKET
U+005E ^ GC=Sk SC=Common CIRCUMFLEX ACCENT
U+005F _ GC=Pc SC=Common LOW LINE
U+0060 ` GC=Sk SC=Common GRAVE ACCENT
U+007B { GC=Ps SC=Common LEFT CURLY BRACKET
U+007C | GC=Sm SC=Common VERTICAL LINE
U+007D } GC=Pe SC=Common RIGHT CURLY BRACKET
U+007E ~ GC=Sm SC=Common TILDE
したがって、次のように、適切な一般カテゴリをクラスに追加します
[\pL\pN\p{Po}]
または、必要な特定の文字を追加するだけです。ところで、\pL
ほとんどの場合、欲しいものは何でも欲しがり\pM
ます。