私たちの Web サイトは、HtmlTidy を介してユーザーの入力を実行し、クリーンアップします。どうやらこれを行っている間、ウムラウトを変換することで、海外の加入者に苦痛を与えているようです. これを行わないように HtmlTidy に指定するオプションはありますか?
可能なすべてのオプションで CharacterEncoding を試しましたが、何も機能していないようです。
私たちの Web サイトは、HtmlTidy を介してユーザーの入力を実行し、クリーンアップします。どうやらこれを行っている間、ウムラウトを変換することで、海外の加入者に苦痛を与えているようです. これを行わないように HtmlTidy に指定するオプションはありますか?
可能なすべてのオプションで CharacterEncoding を試しましたが、何も機能していないようです。
構成ファイルに出力エンコーディング(入力エンコーディングはオプション)を指定するだけです。
input-encoding: win1252
output-encoding: latin1
使用可能なエンコーディングの概要については、output-encodingのドキュメントを参照してください。
編集:つまり、.NETバインディングを使用しています。これはまったく同じ設定です。
Document d = new Document(new FileStream("in.html", FileMode.Open));
d.InputCharacterEncoding = EncodingType.Utf8;
d.OutputCharacterEncoding = EncodingType.Win1252;
d.CleanAndRepair();
d.Save("out.html");
正しいエンコーディングを設定すると、などがなくても正しい結果が得られますü
。