35

ユニコード文字コードとは正確には何ですか? また、ASCII 文字とどう違うのですか?

4

2 に答える 2

54

Unicode は、現在使用されているほぼすべての言語の文字に加えて、数学記号などの他の多くの文字に一意の番号 (コード ポイントと呼ばれる) を割り当てる方法です。UTF-8UTF-16など、Unicode 文字列をバイトとしてエンコードする方法は多数あります。

ASCII は 128 文字 (a ~ z、A ~ Z、0 ~ 9、スペース、一部の句読点、および一部の制御文字) にのみ値を割り当てます。

ASCII 値を持つすべての文字について、その文字の Unicode コード ポイントと ASCII 値は同じです。

最近のほとんどのアプリケーションでは、ASCII ではなく Unicode 文字列を使用することをお勧めします。これにより、たとえば、ユーザーの名前や住所にアクセント付きの文字を使用したり、インターフェイスを英語以外の言語にローカライズしたりできます。

于 2012-04-28T07:38:48.787 に答える
14

最初の 128 のUnicodeコード ポイントは ASCII と同じです。それから彼らは100,000以上を持っています。

Unicode には、各値に 1 ~ 4 バイトを使用するUTF-8 (最初の 128 文字については、UTF-8 は ASCII とまったく同じ) と、2 または 4 バイトを使用する UTF-16 の2 つの一般的な形式があり ます。

于 2012-04-28T07:44:53.783 に答える