正確に Unicode をいつ使用するかについての (簡潔な) 情報はあまり見つかりませんでした。ベスト プラクティスは常に Unicode を使用することだと多くの人が言うことは理解しています。しかし、Unicode 文字列はより多くのメモリ フットプリントを持っています。Unicode は次の場合にのみ使用する必要があると言うのは正しい ですか?
- ローカル以外での画面への出力 (デバッグなど)。
- 一般に、両端が異なるロケール/国にあるネットワークを介して任意のタイプのテキストを送信する
- どれを使えばいいかわからないとき
誰かが Unicode で実際に何が起こるかの基本(簡潔) を説明してくれれば有益だと思います。
- 物理(バイト)文字列は、送信者とは異なる文字列の表現(コードページ、その他...これは興味深いがすでに詳細です)を使用してマシンに送信されます。
コンテキストはプログラミング言語 (C++ など) で Unicode を使用していますが、この質問への回答があらゆるエンコーディング状況に使用できることを願っています。
また、Unicode と NLS が同じものではないことは承知していますが、NLS は Unicode の使用を暗示していると言うのは正しいですか?
PS 素晴らしいサイト