したがって、XMLファイルにこのUTF-8文字列があります。
Horrible place. ☠☠☠
そして、それを外部アプリケーションにフィードすると、面白いキャラクターがXMLエンティティとしてエスケープされて戻ってきます。
Horrible place. ☠☠☠
Rubyで、その文字列をUTF-8に戻すにはどうすればよいですか?これにはおそらく本当に簡単な解決策がありますが、標準ライブラリには何も見つかりません。例えば。CGI.unescapeHTML
(これはのようなものにうまく機能します>
)それらを完全に無視しているようです。
ree-1.8.7-2010.02 > CGI.unescapeHTML('>')
=> ">"
ree-1.8.7-2010.02 > CGI.unescapeHTML('☠')
=> "☠"