2

Java 文字列内の文字が「結合文字である」かどうかを検出する方法を探しています。例えば、

String khmerCombiningVowel = 
 new String(new byte[]{(byte) 0xe1,(byte) 0x9f,(byte) 0x80}, "UTF-8"); // unicode 17c0

結合クメール母音記号を表します。"\\p{InCombiningDiacriticalMarks}" 正規表現を試しましたが、これらの特定の結合文字には適用されないようです。または、文字ブロックを組み合わせたすべてのユニコードの包括的なリストがある場合でも、それらの正規表現を作成できるでしょうか?

4

1 に答える 1