latin1文字を含む文字列をutf8に変換するにはどうすればよいですか?
文字列は、open-uriによって開かれ、これらの特殊文字を含むドキュメントです。
よろしくお願いします
latin1文字を含む文字列をutf8に変換するにはどうすればよいですか?
文字列は、open-uriによって開かれ、これらの特殊文字を含むドキュメントです。
よろしくお願いします
require 'iconv'
i = Iconv.new('UTF-8','LATIN1')
a_with_hat = i.iconv("\xc2")
タグから判断すると、次のようなものが必要だと思います。
require 'rubygems'
require 'open-uri'
require 'nokogiri'
require 'iconv'
file = open(your_uri)
doc = Nokogiri::HTML(Iconv.conv('utf-8', 'latin1', file.readlines.join("\n")))
doc.xpath(your_xpath)
uriが使用する文字セットがわからない場合は、file.charset
の代わりに使用して文字セットを取得できます'latin'
。