2

ご想像のとおり、主にWindows-1252を文字セットとして使用するレガシー Web アプリケーションを扱っています。

また、小さなライブラリ セットをコーディングしました。その中には、アクセントを含むものがあります。これらのファイルは UTF-8 であり、レガシー コードに含まれています。だからここにいる:

                ------------. -------------------
                | | UTF-8 | | | Windows-1252 |
                |------------| |-----------------|
                | | 暗い文字列 | <-------- 内包 -------- | 薄暗い str2 |
                | | str = "エ" | | | str2 = "è" |
                |____________| |_________________|

そうではありませんが、 UTF-8としてエンコードさstr2れたかのように処理されるように聞こえます。"è"

非 ASCII リテラルをコードに記述すべきではないことはわかっていますが、それはレガシーです。さらに、 UTF-8 ファイルを Windows-1252 に変換することを本当に望んでいないことも認めます。また、文字列リテラルを内部表現に変換する前に、エンジンに文字列リテラルの正しい文字セットを伝えるクリーンな方法を探しています。Response.Codepagedoes' は関連性があるか、機能しているようです。新しいファイルを Windows-1252 charset に変換せずにこの問題を解決する他のクリーンな方法はありますか?

4

0 に答える 0