ご想像のとおり、主にWindows-1252を文字セットとして使用するレガシー Web アプリケーションを扱っています。
また、小さなライブラリ セットをコーディングしました。その中には、アクセントを含むものがあります。これらのファイルは UTF-8 であり、レガシー コードに含まれています。だからここにいる:
------------. ------------------- | | UTF-8 | | | Windows-1252 | |------------| |-----------------| | | 暗い文字列 | <-------- 内包 -------- | 薄暗い str2 | | | str = "エ" | | | str2 = "è" | |____________| |_________________|
そうではありませんが、 UTF-8としてエンコードさstr2
れたかのように処理されるように聞こえます。"è"
非 ASCII リテラルをコードに記述すべきではないことはわかっていますが、それはレガシーです。さらに、 UTF-8 ファイルを Windows-1252 に変換することを本当に望んでいないことも認めます。また、文字列リテラルを内部表現に変換する前に、エンジンに文字列リテラルの正しい文字セットを伝えるクリーンな方法を探しています。Response.Codepage
does' は関連性があるか、機能しているようです。新しいファイルを Windows-1252 charset に変換せずにこの問題を解決する他のクリーンな方法はありますか?