1

私は知りたいです:

  1. ANSI (1252) でエンコードされたすべての文字は、問題なく UTF-8 に変換できました。
  2. UTF-8 でエンコードされたすべての文字は、問題なく ANSI (1252) に変換できませんでした (例: Ǣ は ANSI エンコーディングに変換できませんでした)。

それが正しいことを確認していただけますか?

ありがとう !

4

1 に答える 1

3

はい、Windows-1252 で表現可能なすべての文字は Unicode に相当するため、UTF-8 に変換できます。Unicode コード ポイントへのマッピングを示す表については、このウィキペディアの記事を参照してください。

また、Windows-1252 は 8 ビットの文字セットであり、UTF-8 は何千もの異なる文字を表すことができるため、明らかに、UTF-8 として表現でき、Windows-1252 として表現できない文字がたくさんあります。

Windows-1252 エンコーディングの「ANSI」という名前は厳密に間違っていることに注意してください。最初に提案されたときは、ANSI 標準になることを意図していましたが、実現することはありませんでした。残念ながら、名前が固まりました。(Microsoft 関連のドキュメントでは、一般的に UTF-16 を「Unicode」と呼んでいますが、これも別の誤称です。UTF-16 は Unicode の表現の 1 つですが、他にもあります。)

于 2013-04-10T15:29:44.490 に答える