8
4

3 に答える 3

7

以下は、さまざまな俳優の短いプレゼンテーションです。

  • ASCIIは、一連の文字 (127 個あります) と、それらを表すコード (7 ビット) の両方です。

  • Unicodeは文字のセットです (127 を超える数があります)。

  • UTF-8は、Unicode 文字を表すコードです。

  • あなたの端末。プログラムによるバイト出力を UTF-8 エンコード文字として解釈し、対応する Unicode 文字を表示します。

  • OCaml はバイトのシーケンスを処理します (OCaml は名前を使用しますcharが、誤解を招くので名前のbyte方が適切です)。

したがって、OCaml が の UTF-8 コードに対応するバイト列を出力すると"你好"、端末はそれを utf-8 文字列として解釈し、 を出力します你好。しかし、OCamlの場合"你好"は、6 バイトのシーケンスです。

于 2013-04-24T19:57:01.123 に答える