c - unsigned char 140、unicode 0x0152 = 338 のコードページまたはエンコーディングは何ですか?

Question

おそらくプログラマーはエンコーディングの基礎を読んでいますが、私の具体的な質問は

Windows コンソールへの Windows Visual C 出力では、unsigned char 値 140 がunicode 0x0152 = 338 として出力されます。

Visual C が使用しているエンコーディング (または「コードページ」?) は何ですか? (例: UTF-7、ASCII)。unsigned char 値 140 は Unicode 文字 338 にどのくらい正確にマッピングされますか?

誰でも、エンコーディングに関する多くのウィキペディアのページまたは Web 上のテーブルへのリンクを貼り付けることができると確信していますが、質問に対するより具体的な回答があればよいでしょう。

score 0 · Accepted Answer

それはWindows-1252をエンコードすることになり、Visual C がそれを「使用」しているわけではなく、Windows コンソールが出力を解釈しているものです。

この他の答えは、あなたが求めているものかもしれません: cmd.exe はどのエンコーディング/コードページを使用していますか?

「コードページ」は、「コード化された文字セット」に対する Microsoft の用語であり、「エンコーディング」と考えられるものとほぼ同等ですが、正確な定義についてはUnicode Glossaryを参照してください。

ウィキペディアのページを引用するには：

歴史的に、"ANSI コードページ" (ACP) というフレーズは、ネイティブと見なされるさまざまなコードページを指すために Windows で使用されていました。その意図は、これらのほとんどが ISO-8859-1 などの ANSI 標準であるということでした。Windows-1252 は、Microsoft Windows の用語でそのように名付けられた最初のコードページであり、最も人気のあるコードページでしたが、コードページは ANSI 標準ではありませんでした。マイクロソフト関連のブロガーは現在、「Windows コードページを表すために使用される ANSI という用語は歴史的な参考文献ですが、現在では Windows コミュニティで存続し続けている誤称です」と述べています。

c - unsigned char 140、unicode 0x0152 = 338 のコードページまたはエンコーディングは何ですか?

1 に答える 1

Related

Reference