JavaはUTF-16の内部で文字を保持しているため、Unicodeにまったく含まれていない文字を含む特定のエンコーディングで出力する必要がある場合はどうなりますか?
質問する
394 次
1 に答える
1
Javaは基本的にUnicodeに存在する文字しか扱えません。BMP の外側 (つまり、U+FFFF より上) のテキストは、サロゲート ペアとしてエンコードされます (それぞれchar
が UTF-16 コード単位であるため)... しかし、Unicode にまったくない文字が必要な場合は、自分で-おそらく、私的使用のために予約されているUnicodeの領域を見つけて、そこに文字をマッピングすることができます...しかし、あらゆる種類の奇妙な方法で「楽しむ」ことができます.
Unicode にない文字を処理する必要がありますか? 最近はほぼすべてをカバーしていると思っていました...
于 2012-11-19T20:16:43.903 に答える