0

したがって、この二重にエンコードされた UTF-8 ファイルがあります。例えば。

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<title>test</title>
</head>

<body>
<p>this is a “testâ€Â&lt;/p>
</body>
</html>

URL: http://www.frostjedi.com/terra/scripts/demo/utf8-1.html

Firefox でソースを表示し、それをコピーして新しいファイルに貼り付けると、二重エンコーディングが事実上元に戻りました。例えば。

http://www.frostjedi.com/terra/scripts/demo/utf8-2.html

私の質問は...どうすればCLI経由でこれを行うことができますか?

私はこれを試しました:

iconv -f UTF-8 -t ISO-8859-1 utf8-1.html > utf8-3.html

しかし、これを得ました:

iconv: illegal input sequence at position 294

何か案は?

4

1 に答える 1