9

latin1文字を含む文字列をutf8に変換するにはどうすればよいですか?

文字列は、open-uriによって開かれ、これらの特殊文字を含むドキュメントです。

よろしくお願いします

4

2 に答える 2

16

Iconv

require 'iconv'
i = Iconv.new('UTF-8','LATIN1')
a_with_hat = i.iconv("\xc2")
于 2009-10-07T10:26:33.227 に答える
4

タグから判断すると、次のようなものが必要だと思います。

require 'rubygems'
require 'open-uri'
require 'nokogiri'
require 'iconv'

file = open(your_uri)
doc = Nokogiri::HTML(Iconv.conv('utf-8', 'latin1', file.readlines.join("\n")))
doc.xpath(your_xpath)

uriが使用する文字セットがわからない場合は、file.charsetの代わりに使用して文字セットを取得できます'latin'

于 2009-10-07T11:40:13.947 に答える