0

この一連の RegEx の何が問題になっていますか/^[\p{L}\p{N}]+/u。私の先輩が% openmovedに入ったとき、正規表現はfalseを返します。この形式を受け入れるために必要です

% オープンマインド
100% オープンマインド オープン
マインド 100%

式には何を追加する必要がありますか? ユーザーが%最初に入力したり、特殊文字を入力したりしても、入力を受け入れるようにします。

4

1 に答える 1

5

パーセント記号は記号ではありません\pSunipropsで説明され ているように、これは\pP句読点です。

$ uniprops %
U+0025 ‹%› \N{PERCENT SIGN}
    \pP \p{Po}
    All Any ASCII Assigned Basic_Latin Common Zyyy Po P Gr_Base Grapheme_Base Graph GrBase Other_Punctuation Punct Pat_Syn Pattern_Syntax PatSyn POSIX_Graph POSIX_Print POSIX_Punct Print Punctuation X_POSIX_Graph X_POSIX_Print X_POSIX_Punct

お気に入りのキャラクターが属する一般的なカテゴリ (およびおそらくスクリプト) に慣れておく必要があります。unicharsを実行した場合の出力例を次に示します。

$ unichars -gs '[\pP\pS]' '\p{Block=Basic_Latin}'
U+0021 ‭ !  GC=Po SC=Common       EXCLAMATION MARK
U+0022 ‭ "  GC=Po SC=Common       QUOTATION MARK
U+0023 ‭ #  GC=Po SC=Common       NUMBER SIGN
U+0024 ‭ $  GC=Sc SC=Common       DOLLAR SIGN
U+0025 ‭ %  GC=Po SC=Common       PERCENT SIGN
U+0026 ‭ &  GC=Po SC=Common       AMPERSAND
U+0027 ‭ '  GC=Po SC=Common       APOSTROPHE
U+0028 ‭ (  GC=Ps SC=Common       LEFT PARENTHESIS
U+0029 ‭ )  GC=Pe SC=Common       RIGHT PARENTHESIS
U+002A ‭ *  GC=Po SC=Common       ASTERISK
U+002B ‭ +  GC=Sm SC=Common       PLUS SIGN
U+002C ‭ ,  GC=Po SC=Common       COMMA
U+002D ‭ -  GC=Pd SC=Common       HYPHEN-MINUS
U+002E ‭ .  GC=Po SC=Common       FULL STOP
U+002F ‭ /  GC=Po SC=Common       SOLIDUS
U+003A ‭ :  GC=Po SC=Common       COLON
U+003B ‭ ;  GC=Po SC=Common       SEMICOLON
U+003C ‭ <  GC=Sm SC=Common       LESS-THAN SIGN
U+003D ‭ =  GC=Sm SC=Common       EQUALS SIGN
U+003E ‭ >  GC=Sm SC=Common       GREATER-THAN SIGN
U+003F ‭ ?  GC=Po SC=Common       QUESTION MARK
U+0040 ‭ @  GC=Po SC=Common       COMMERCIAL AT
U+005B ‭ [  GC=Ps SC=Common       LEFT SQUARE BRACKET
U+005C ‭ \  GC=Po SC=Common       REVERSE SOLIDUS
U+005D ‭ ]  GC=Pe SC=Common       RIGHT SQUARE BRACKET
U+005E ‭ ^  GC=Sk SC=Common       CIRCUMFLEX ACCENT
U+005F ‭ _  GC=Pc SC=Common       LOW LINE
U+0060 ‭ `  GC=Sk SC=Common       GRAVE ACCENT
U+007B ‭ {  GC=Ps SC=Common       LEFT CURLY BRACKET
U+007C ‭ |  GC=Sm SC=Common       VERTICAL LINE
U+007D ‭ }  GC=Pe SC=Common       RIGHT CURLY BRACKET
U+007E ‭ ~  GC=Sm SC=Common       TILDE

したがって、次のように、適切な一般カテゴリをクラスに追加します

 [\pL\pN\p{Po}]

または、必要な特定の文字を追加するだけです。ところで、\pLほとんどの場合、欲しいものは何でも欲しがり\pMます。

于 2012-02-14T04:15:27.240 に答える