1

JavaはUTF-16の内部で文字を保持しているため、Unicodeにまったく含まれていない文字を含む特定のエンコーディングで出力する必要がある場合はどうなりますか?

4

1 に答える 1

1

Javaは基本的にUnicodeに存在する文字しか扱えません。BMP の外側 (つまり、U+FFFF より上) のテキストは、サロゲート ペアとしてエンコードされます (それぞれcharが UTF-16 コード単位であるため)... しかし、Unicode にまったくない文字が必要な場合は、自分で-おそらく、私的使用のために予約されているUnicodeの領域を見つけて、そこに文字をマッピングすることができます...しかし、あらゆる種類の奇妙な方法で「楽しむ」ことができます.

Unicode にない文字を処理する必要がありますか? 最近はほぼすべてをカバーしていると思っていました...

于 2012-11-19T20:16:43.903 に答える