Java 文字列内の文字が「結合文字である」かどうかを検出する方法を探しています。例えば、
String khmerCombiningVowel =
new String(new byte[]{(byte) 0xe1,(byte) 0x9f,(byte) 0x80}, "UTF-8"); // unicode 17c0
結合クメール母音記号を表します。"\\p{InCombiningDiacriticalMarks}"
正規表現を試しましたが、これらの特定の結合文字には適用されないようです。または、文字ブロックを組み合わせたすべてのユニコードの包括的なリストがある場合でも、それらの正規表現を作成できるでしょうか?