7

「highascii」または「extendedascii」文字を参照する技術的に正しい方法は何ですか?128〜255の範囲だけでなく、0〜127の範囲を超える文字も意味します。

多くの場合、発音区別符号、アクセント付き文字と呼ばれ、「国別」または英語以外の文字と呼ばれることもありますが、これらの名前は不正確であるか、可能な文字のサブセットのみをカバーしています。

プログラマーがすぐに認識する正確で正確な用語は何ですか?そして、技術者以外の聴衆と話すときに使用するのに最適な英語の用語は何でしょうか?

4

8 に答える 8

18

「非ASCII文字」

于 2009-10-02T17:24:17.503 に答える
2

127 を超える ASCII 文字コードは定義されていません。多くのさまざまな機器やソフトウェアのサプライヤが、値 128 ~ 255 用に独自の文字セットを開発しました。描画記号を選択した人もいれば、アクセント文字を選択した人もいれば、他の文字を選択した人もいました。

Unicode は、ほとんどの言語で使用される文字を含む文字コードの普遍的なセットを作成する試みです。これには、伝統的な西洋のアルファベットだけでなく、キリル文字、アラビア語、ギリシャ語、さらには中国語、日本語、韓国語の文字の大規模なセット、さらには現代および古代の他の多くの言語が含まれます.

Unicode にはいくつかの実装があります。UTF-8 の場合、最も人気のあるものの 1 つです。その人気の主な理由は、ASCII との下位互換性があり、文字コード 0 から 127 は ASCII と UTF-8 の両方で同じです。

つまり、ASCII は UTF-8 のサブセットであると言った方が適切です。文字コード 128 以上は ASCII ではありません。UTF-8 (または他の Unicode) にすることも、ハードウェアまたはソフトウェアのサプライヤによるカスタム実装にすることもできます。

于 2009-10-02T18:01:27.677 に答える
1

「trans-ASCII」、「supra-ASCII」、「ultra-ASCII」などの用語を作ることもできます。実際には、「meta-ASCII」はメタ ビットを暗示しているため、さらに適切です。

于 2009-10-02T17:44:01.380 に答える
0

ASCII文字を表さないビットシーケンスは、明確にUnicode文字ではありません。

使用している文字エンコードに応じて、次のいずれかになります。

  • 無効なビットシーケンス
  • Unicode文字
  • ISO-8859-x文字
  • Microsoft1252文字
  • 他の文字エンコードの文字
  • バグ、バイナリデータなど

これらすべての状況に適合する1つの定義は次のとおりです。

  • ASCII文字ではありません

非常に衒学的であるために、「非ASCII文字」でさえ、これらの状況のすべてに正確に適合するわけではありません。この範囲外のビットシーケンスは、文字ではなく、単に無効なビットシーケンスである場合があるためです。

于 2010-05-27T05:56:06.323 に答える
0

「拡張 ASCII」は私が使用する用語で、「元の 0 ~ 127 を超える文字」を意味します。

Unicode は拡張 ASCII 文字の可能なセットの 1 つであり、非常に大きなものです。

UTF-8 は、元の ASCII と下位互換性がある Unicode 文字を表す方法です。

于 2009-10-02T17:25:02.040 に答える
0

書いて答えるのに便利で適切だと思ったので、オンラインリソース(クールなウェブサイトですが)から言葉を借りました。

最初は大文字と数字のみが含まれていましたが、1967 年に小文字といくつかの制御文字が追加され、US-ASCII として知られる文字 0 ~ 127 が形成されました。したがって、この 128 文字のみのセットが 1967 年に公開されました。標準として、英語で書くために必要なすべてが含まれています。

1981 年、IBM は「コード ページ 437」と呼ばれる 8 ビット ASCII コードの拡張機能を開発しました。このバージョンでは、グラフィック文字の一部の廃止された制御文字が置き換えられました。また、128 文字が追加され、新しい記号、記号、グラフィックス、ラテン文字、すべての句読点記号、およびスペイン語などの他の言語でテキストを書くために必要な文字が追加されました。このようにして、128 から 255 の範囲の ASCII 文字が追加されました。

IBM は、「IBM-PC」として知られる、最初のパーソナル コンピュータと見なされているモデル 5150 のハードウェアに、このコード ページのサポートを含めています。この機種のOS「MS-DOS」もこの拡張ASCIIコードを使用していました。

于 2017-07-04T06:08:00.297 に答える
-1

「HighASCII」と言う場合、定義上、10進数で128〜255の範囲です。ASCII自体は、1バイト(実際には7ビット)の文字表現として定義されています。英語以外の文字を許可するための上位ビットの使用は後で発生し、特定の値で表される特定の文字を定義するコードページを作成しました。マルチバイト(> 255の10進値)はASCIIではありません。

于 2009-10-02T19:51:34.073 に答える
-1

非 ASCII Unicode 文字。

于 2009-10-02T17:16:38.813 に答える