JavaScript 文字列を「文字」に分割することは簡単にできますが、Unicode を気にする場合 (そして Unicode を気にする必要がある場合) には問題があります。
JavaScript はネイティブに文字を 16 ビット エンティティ ( UCS-2 または UTF-16 ) として扱いますが、これはBMP (Basic Multilingual Plane)以外の Unicode 文字を許可しません。
BMP を超える Unicode 文字を処理するために、JavaScript は「サロゲート ペア」を考慮に入れる必要がありますが、これはネイティブには行われません。
コードポイントが1つまたは2つのJavaScript「文字」(コード単位)を必要とするかどうかにかかわらず、コードポイントでjs文字列を分割する方法を探しています。
必要に応じて、コードポイントによる分割では不十分な場合があり、"書記素クラスター" で分割することをお勧めします。ここで、クラスターはベース コードポイントであり、その後にすべての非間隔修飾子コードポイントが続きます (アクセントと発音記号の組み合わせなど) 。
この質問の目的のために、書記素クラスターによる分割は必要ありません。