多くの異なる文字を含む文字列があり、Unicode の [Po] カテゴリにあるすべての文字で文字列を分割できるようにしたいと考えています。
どうすれば簡単にこれを行うことができますか (つまり、このリスト内のすべての文字を列挙して巨大な文字配列を作成し、それによって分割することを避けたい)? また、これらの文字が保存される方法には、これを容易にする共通のプロパティがあると思います。
では、すべての Unicode 句読点で文字列を分割するにはどうすればよいでしょうか?
このPo
カテゴリは.NET 正規表現エンジンでサポートされているため、次のように簡単に実行できます。
Regex.Split("this,is.a!test", @"\p{Po}") // [ "this", "is", "a", "test" ]