こんにちは、スタック オーバーフロー コミュニティです。
UTF-16 は、2 バイトの文字セットまたは 4 バイトの文字セットです。
私が理解しているように、4 バイト文字セットは、high(16) と low(16) のサロゲートで構成されています。
UTF-8 は、1 バイト、2 バイト、3 バイト、4 バイト、または最大 7 バイトのいずれかです。
しかし、最初のオクテットのビットを見れば、UTF-8 からのバイト数を簡単に知ることができます。
UTF-16 と UTF-32 からのバイト サイズをどのように特定するのだろうか。
Unicode に関する皆様のご支援とご意見をお待ちしております。
ありがとう。
ドンソプ