libxmlで読んでいるxmlノードに次の属性があります。reader.nodeを印刷すると、アクセント付きの文字で正常に印刷されます。
reader = XML::Reader.new(File.open("somefile.xml", "r"))
reader.read
reader.read
...
p reader.node
=> ... Full_Name="Univisión Network - East Feed" ...
でもこれをやると逃げて出てきます。
p reader.node["Full_Name"]
=> "Univisi\xC3\xB3n Network - East Feed"
そして、この値をjson laaterに変換しようとすると、次のエラーが発生します。
Encoding::UndefinedConversionError: "\xC3" from ASCII-8BIT to UTF-8
これがドキュメントのxml行です
<?xml version="1.0" encoding="ISO-8859-1"?>
xmlドキュメント自体を制御することはできません。そのユニコード文字をjsonに戻す、またはjsonが理解できる形式に戻すにはどうすればよいですか?
編集:ああ、私は言及するのを忘れました-これは実際のXMLドキュメントでどのように見えるかです
Full_Name="Univisión Network - East Feed"