私のインタビューの 1 つで、インタビュアーはなぜ ASCII テーブルで大文字が小文字の前にあるのかと私に尋ねました。ありがとう!
3 に答える
推測にすぎませんが、初期の文字セットには小文字がまったくなかったからだと思います。Baudot 電信コードはわずか 5 ビットであり、CDC メインフレームはネイティブで 6 ビット コードを使用していました。小文字の余地がありませんでした。ASCII が 7 ビット コードとして開発され、最終的に小文字に十分なスペースが確保されたとき、それらは贅沢なアドオンのようなものと見なされたため、セットの後半に配置することは理にかなっています。
ただし、この順序はASCII に固有のものであり、他の文字セットには必ずしも当てはまらないことに注意してください。たとえば、EBCDIC では小文字が最初になります。コモドール マイクロコンピュータは 2 つの文字セットを切り替えることができ、どちらも ASCII に基づいていましたが、小文字の文字セットが先にありました。(他のセットには、小文字の代わりに追加のグラフィック文字がありました。)
Unicode は ASCII (およびそれに基づく拡張ラテン文字セット) からヒントを得ているため、大文字と小文字が区別されるアルファベットのほとんどは、コード ブロック内で大文字バージョンが最初に来ます。しかし、例外もあります。もちろん、他の多くのアルファベットには大文字と小文字の区別がまったくありませんが、単純な 1 対 1 のマッピングよりも複雑な関係を持つアルファベットもあります。
テキストを並べ替えるときに小文字が大文字の前に来ないようにするため。
現代の Unicode 時代では、テキストの並べ替えははるかに複雑ですが、20 年前にはテキストを ASCII 値で並べ替えることができました。