私は知りたいです:
- ANSI (1252) でエンコードされたすべての文字は、問題なく UTF-8 に変換できました。
- UTF-8 でエンコードされたすべての文字は、問題なく ANSI (1252) に変換できませんでした (例: Ǣ は ANSI エンコーディングに変換できませんでした)。
それが正しいことを確認していただけますか?
ありがとう !
私は知りたいです:
それが正しいことを確認していただけますか?
ありがとう !
はい、Windows-1252 で表現可能なすべての文字は Unicode に相当するため、UTF-8 に変換できます。Unicode コード ポイントへのマッピングを示す表については、このウィキペディアの記事を参照してください。
また、Windows-1252 は 8 ビットの文字セットであり、UTF-8 は何千もの異なる文字を表すことができるため、明らかに、UTF-8 として表現でき、Windows-1252 として表現できない文字がたくさんあります。
Windows-1252 エンコーディングの「ANSI」という名前は厳密に間違っていることに注意してください。最初に提案されたときは、ANSI 標準になることを意図していましたが、実現することはありませんでした。残念ながら、名前が固まりました。(Microsoft 関連のドキュメントでは、一般的に UTF-16 を「Unicode」と呼んでいますが、これも別の誤称です。UTF-16 は Unicode の表現の 1 つですが、他にもあります。)