Hpricot を使用するクローラーを作成しています。いくつかの Web ページから文字列のリストをダウンロードし、それをファイルに書き込もうとします。エンコーディングに何か問題があります:
"\xC3" from ASCII-8BIT to UTF-8
Webページにレンダリングされ、この方法で印刷されるアイテムがあります:
Développement
str.encoding
返品UTF-8
されるので、役に立ちforce_encoding('UTF-8')
ません。これを読み取り可能な UTF-8 に変換するにはどうすればよいですか?