同じ Unicode (標準化された)テーブルの異なるエンコーディングがあります。たとえば、UTF-8 エンコーディングの場合A
は に対応し 0x0041
ますが、UTF-16 エンコーディングの場合A
はとして表され 0xfeff0041
ます。
この素晴らしい記事から、Windows プラットフォーム用に C++ でプログラミングし、Unicode を扱う場合、Unicode が 2 バイトで表されることを知っておく必要があることを学びました。しかし、エンコーディングについては何も述べていません。(x86 CPU はリトル エンディアンであると言われているので、これらの 2 バイトがメモリに格納される方法を知っています。) しかし、シンボルがメモリに格納される方法に関する完全な情報を得るために、Unicode のエンコーディングも知っておく必要があります。C++/Windows プログラマ向けの固定 Unicode エンコーディングはありますか?