0

おそらくプログラマーはエンコーディングの基礎を読んでいますが、私の具体的な質問は

Windows コンソールへの Windows Visual C 出力では、unsigned char 値 140 がunicode 0x0152 = 338 として出力されます。

Visual C が使用しているエンコーディング (または「コード ページ」?) は何ですか? (例: UTF-7、ASCII)。unsigned char 値 140 は Unicode 文字 338 にどのくらい正確にマッピングされますか?

誰でも、エンコーディングに関する多くのウィキペディアのページまたは Web 上のテーブルへのリンクを貼り付けることができると確信していますが、質問に対するより具体的な回答があればよいでしょう。

4

1 に答える 1

0

それはWindows-1252をエンコードすることになり、Visual C がそれを「使用」しているわけではなく、Windows コンソールが出力を解釈しているものです。

この他の答えは、あなたが求めているものかもしれません: cmd.exe はどのエンコーディング/コード ページを使用していますか?

「コード ページ」は、「コード化された文字セット」に対する Microsoft の用語であり、「エンコーディング」と考えられるものとほぼ同等ですが、正確な定義についてはUnicode Glossaryを参照してください。

ウィキペディアのページを引用するには:

歴史的に、"ANSI コード ページ" (ACP) というフレーズは、ネイティブと見なされるさまざまなコード ページを指すために Windows で使用されていました。その意図は、これらのほとんどが ISO-8859-1 などの ANSI 標準であるということでした。Windows-1252 は、Microsoft Windows の用語でそのように名付けられた最初のコード ページであり、最も人気のあるコード ページでしたが、コード ページは ANSI 標準ではありませんでした。マイクロソフト関連のブロガーは現在、「Windows コード ページを表すために使用される ANSI という用語は歴史的な参考文献ですが、現在では Windows コミュニティで存続し続けている誤称です」と述べています。

于 2012-12-05T22:23:03.277 に答える