utf-8 - ANSI から UTF-8 への変換

Question

私は知りたいです:

ANSI (1252) でエンコードされたすべての文字は、問題なく UTF-8 に変換できました。
UTF-8 でエンコードされたすべての文字は、問題なく ANSI (1252) に変換できませんでした (例: Ǣ は ANSI エンコーディングに変換できませんでした)。

それが正しいことを確認していただけますか？

ありがとう！

score 3 · Accepted Answer

はい、Windows-1252 で表現可能なすべての文字は Unicode に相当するため、UTF-8 に変換できます。Unicode コードポイントへのマッピングを示す表については、このウィキペディアの記事を参照してください。

また、Windows-1252 は 8 ビットの文字セットであり、UTF-8 は何千もの異なる文字を表すことができるため、明らかに、UTF-8 として表現でき、Windows-1252 として表現できない文字がたくさんあります。

Windows-1252 エンコーディングの「ANSI」という名前は厳密に間違っていることに注意してください。最初に提案されたときは、ANSI 標準になることを意図していましたが、実現することはありませんでした。残念ながら、名前が固まりました。(Microsoft 関連のドキュメントでは、一般的に UTF-16 を「Unicode」と呼んでいますが、これも別の誤称です。UTF-16 は Unicode の表現の 1 つですが、他にもあります。)

utf-8 - ANSI から UTF-8 への変換

1 に答える 1

Related

Reference