Emacs 23.1ニュースから:
***Emacsの文字セットはUnicodeのスーパーセットになりました。(コードスペースは約4倍あり、十分なはずです)。
そして後で詳細:
***マルチバイトバッファおよび文字列では、文字はUTF-8バイトシーケンスで表されます。文字コードスペースは0x0..0x3FFFFFになり、ギャップはありません。コードポイント0x0..0x10FFFFは同じコードポイントのUnicode文字ですが、コードポイント0x3FFF80..0x3FFFFFは生の8ビットバイトです。
ウィキペディアによると、UCSのBMPには65536文字、最新バージョンのUnicodeには107000文字以上、UCSには100万以上のコードポイントが含まれています。0x3FFFFFは400万を超えています。
どのような問題を解決できますか、それ以外の場合は、Unicodeのスーパーセットである内部文字セットを使用することがどのように有益ですか?