私が取得したいWebページには、windows-1251文字セットエンコーディングがあります。このページを単にダウンロードするだけでなく、自動的に..うーん..内部のテキストをuft-8に変換する方法はありますか?
wget のように追加のパラメーターを追加しようとしました
--header='Accept-Charset: utf-8'
しかし運がない。
私が取得したいWebページには、windows-1251文字セットエンコーディングがあります。このページを単にダウンロードするだけでなく、自動的に..うーん..内部のテキストをuft-8に変換する方法はありますか?
wget のように追加のパラメーターを追加しようとしました
--header='Accept-Charset: utf-8'
しかし運がない。
使用できます
iconv -f ISO-8859-1 -t UTF-8 ./index.html > ./utf.html
エンコーディングを変換します。https://wiki.archlinux.org/index.php/Convert_a_text_file%27s_encodingを参照してください