ASCII 形式のキリル文字が必要な場合は、拡張 ASCII テーブルが必要になることを意味しますよね? cp-1251 が ASCII の拡張であるかどうか、そうでない場合は何と見なされるかを知りたいです。グーグルで検索するのに少し戸惑いました。他の拡張子のコードページだと言うところもあります。
また、コード 206 の cp-1251 文字 O がある場合、同じ文字の UTF-8 値は 041E になりますよね?
ASCII 形式のキリル文字が必要な場合は、拡張 ASCII テーブルが必要になることを意味しますよね? cp-1251 が ASCII の拡張であるかどうか、そうでない場合は何と見なされるかを知りたいです。グーグルで検索するのに少し戸惑いました。他の拡張子のコードページだと言うところもあります。
また、コード 206 の cp-1251 文字 O がある場合、同じ文字の UTF-8 値は 041E になりますよね?
「拡張 ASCII」はあいまいな用語です。
US-ASCII は 128 の値をサポートし (8 番目のビットは予約済み)、キリル文字のコード ポイントはサポートしません。Windows 1251の前半では、コード ポイントが同じ範囲の値にマップされます。同じことがUTF-8にも当てはまります。したがって、ASCII としてエンコードされたドキュメントはすべて、Windows 1252、Windows 1251、UTF-8、ISO-8859-1、およびその他のいくつかのエンコードで有効です。
ASCII、Windows-1251、または UTF-8 としてエンコードされた U+004F (LATIN CAPITAL LETTER O) は4F
、16 進エディタを使用して表示すると、同じオクテット値 ( ) になります。
自然言語データの場合、ほとんどの非 Unicode エンコーディングは廃止されたと見なす必要があります。
ASCII が標準です。7ビットコードです。0 ~ 127 の範囲の値が含まれます。それ以外はすべて ASCII ではありません。
PC では、コード ページを扱うことができます。関心のある文字を含むコード ページを選択できる場合があります。
ASCII や、これまでに発明されたほとんどすべての文字をサポートできるUnicodeを調べることは有益かもしれません。