1

ASCII 形式のキリル文字が必要な場合は、拡張 ASCII テーブルが必要になることを意味しますよね? cp-1251 が ASCII の拡張であるかどうか、そうでない場合は何と見なされるかを知りたいです。グーグルで検索するのに少し戸惑いました。他の拡張子のコードページだと言うところもあります。

また、コード 206 の cp-1251 文字 O がある場合、同じ文字の UTF-8 値は 041E になりますよね?

4

3 に答える 3

2

「拡張 ASCII」はあいまいな用語です。

US-ASCII は 128 の値をサポートし (8 番目のビットは予約済み)、キリル文字のコード ポイントはサポートしません。Windows 1251の前半では、コード ポイントが同じ範囲の値にマップされます。同じことがUTF-8にも当てはまります。したがって、ASCII としてエンコードされたドキュメントはすべて、Windows 1252、Windows 1251、UTF-8、ISO-8859-1、およびその他のいくつかのエンコードで有効です。

ASCII、Windows-1251、または UTF-8 としてエンコードされた U+004F (LATIN CAPITAL LETTER O) は4F、16 進エディタを使用して表示すると、同じオクテット値 ( ) になります。

自然言語データの場合、ほとんどの非 Unicode エンコーディングは廃止されたと見なす必要があります。

于 2013-05-27T13:24:19.913 に答える
1

ASCII が標準です。7ビットコードです。0 ~ 127 の範囲の値が含まれます。それ以外はすべて ASCII ではありません。

PC では、コード ページを扱うことができます。関心のある文字を含むコード ページを選択できる場合があります。

ASCII や、これまでに発明されたほとんどすべての文字をサポートできるUnicodeを調べることは有益かもしれません。

于 2013-05-27T13:19:37.523 に答える