文字クラスで指定できるunicode groups
andは何 ですか?block ranges
\p{name}
例えば
\p{IsGreek}
名前と説明のリストはどこにありますか?
文字クラスで指定できるunicode groups
andは何 ですか?block ranges
\p{name}
例えば
\p{IsGreek}
名前と説明のリストはどこにありますか?
Regular-Expressions.infoにはリストがあります。
PCRE 自体のマニュアル ページを参照することもできます。
Unicode 文字のセットは、特定のスクリプトに属するものとして定義されています。これらのセットのいずれかの文字は、スクリプト名を使用して一致させることができます。例えば:
\p{Greek} \P{Han}
識別されたスクリプトの一部ではないものは、「共通」としてひとまとめにされます。スクリプトの現在のリストは次のとおりです。
アラビア語、アルメニア語、アベスタン語、バリ語、バムム語、ベンガル語、ボポモフォ語、点字、ブギ語語、ブヒド語、カナダのアボリジニ語、カリアン語、チャム語、チェロキー語、共通語、コプト語、楔形文字、キプロス語、キリル語、デゼレト語、デバナーガリ語、エジプト語のヒエログリフ、エチオピア語、グルジア語、グラゴル語、ゴシック、ギリシャ語、グジャラート語、グルムキー語、漢語、ハングル語、ハヌヌー語、ヘブライ語、ひらがな、Imperial_Aramaic、継承、Inscriptional_Pahlavi、Inscriptional_Parthian、ジャワ語、カイティ語、カンナダ語、カタカナ、カヤー_リ、カロスティ語、クメール語、ラオス語、ラテン語、レプチャ語、リンブ語、Linear_B、 Lisu、Lycian、Lydian、Malayalam、Meetei_Mayek、モンゴル語、ミャンマー、New_Tai_Lue、Nko、Ogham、Old_Italic、Old_Persian、Old_South_Arabian、Old_Turkic、Ol_Chiki、Oriya、Osmanya、Phags_Pa、Phoenician、Rejang、Runic、Samaritan、Saurashtra、Shavian、Sinhala、スンダ語、シロティナグリ語、シリア語、Tagalog、Tagbanwa、Tai_Le、Tai_Tham、Tai_Viet、Tamil、Telugu、Thaana、Thai、Tibetan、Tifinagh、Ugaritic、Vai、Yi。
ここでは、括弧内に指定できるUnicode 文字プロパティのリストを見つけることができます: http://en.wikipedia.org/wiki/Mapping_of_Unicode_characters#Categories
または、 Unicode BlocksまたはScriptsに一致させることができます。それに関する情報は、http: //www.regular-expressions.info/unicode.html#blockおよびhttp://www.regular-expressions.info/unicode.htmlで見つけることができます。 #スクリプト.