私は会社で Unicode とエンコーディングについて技術的な講演を行っています。その中で、文字列は常にエンコードされていること、開発者はすべてが 0 ~ 127 ASCII であると不用意に想定してはならないことを強調しようとしています。
誤ってエンコードされたテキストが原因で発生した問題の例は数多くありますが、Unicodeコード ポイント127を超えてエンコードされた数字を含む単純な英語のテキストの例は見つかりませんでした。
基本的な英語のアルファベットは、Unicode で単純な古い ASCII と同じ数値にマッピングされます。範囲A-Z
は[65-90]
(または[0x41-0x5a]
hex) に[a-z]
マッピングされ、[97-122]
(hex [0x61-0x7a]
) にマッピングされます。
英語のアルファベットはコード表のどこかに表示されますか? サーカムフレックス文字やその他のラテン語の変形を意味するのではなく、単なる英語のアルファベットです。