正規表現を介した言語固有のバリデーターに興味があります。次のようなパターンで、任意の言語で人の名前を検証できることを知っています。
“[\p{L}\p{M}]”
しかし、特定の言語の検証を行う場合はどうなりますか?私のスレッドのCurrentUICultureまたはCurrentCulture設定が、の意味"[\w]"
をドイツ語、スペイン語、英語、特に中国語に適したものに単純に変換するのであれば、それは素晴らしいことです。それはそのように機能しますか?はいの場合、これはおそらく私の答えです。
そうでない場合、私の次の関心は正規表現スクリプト注釈を使用することです。しかし、私はそれに気づきます:
- そのリンクにあるリストには、私が特に興味を持っている簡体字の「中国語」は含まれていません。
- .NET正規表現機能がスクリプトベースのマッチングをサポートしているとは思いません。はい?いいえ?
したがって、前の2つのオプションを機能させることができない場合の最後のオプションは、名前付きブロックを使用することです。少なくとも.netでサポートされている名前付きブロックのリストには、CJKのいくつかのエントリが含まれています。いくつかのCJKブロックを単純に組み合わせて、それを(簡体字)「中国語」と呼ぶことができると思います。
考え?