したがって、この二重にエンコードされた UTF-8 ファイルがあります。例えば。
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<title>test</title>
</head>
<body>
<p>this is a “testâ€Â</p>
</body>
</html>
URL: http://www.frostjedi.com/terra/scripts/demo/utf8-1.html
Firefox でソースを表示し、それをコピーして新しいファイルに貼り付けると、二重エンコーディングが事実上元に戻りました。例えば。
http://www.frostjedi.com/terra/scripts/demo/utf8-2.html
私の質問は...どうすればCLI経由でこれを行うことができますか?
私はこれを試しました:
iconv -f UTF-8 -t ISO-8859-1 utf8-1.html > utf8-3.html
しかし、これを得ました:
iconv: illegal input sequence at position 294
何か案は?