2
4

2 に答える 2

3

ISO-8859-1 は、1 文字あたり 1 バイトのエンコーディングです。派手な Unicode 二重引用符は、ISO-8859-1 文字セットにはありません。したがって、表示されているのは、ISO-8859-1 バイトのシーケンスとして表されるマルチバイト文字です。

これらの奇妙なことに対応するには、perlunicodeのman ページ、特に \x{...} と \N{...} エスケープ シーケンスを参照してください。

質問に答えるには、\x{201C} を Unicode の左二重引用符に一致させ、\x{201D} を右二重引用符に一致させてみてください。質問で後者を見逃しました:-)。

[アップデート]

参考文献を提供するべきでした... 英国の素敵な紳士がASCII と Unicode の引用符に関するページを持っています。普通の ASCII/ISO-8859-1 二重引用符は、単に引用符と呼ばれます。

于 2011-06-11T00:12:32.507 に答える
-1

これOld postが役立つかもしれません..

于 2011-06-14T09:46:06.770 に答える