1

Nokogiriを使用して1つのオランダのサイトからいくつかのデータを解析し、データをcsvに保存しています。ただし、データは正しく表示されません。たとえば、フォームにはEinddatum1の空のスペースがありますが、保存する前にコンソールに印刷すると、「\u00A0」と表示されます。また、「Univ \ u00E9 Zorg Geregeld Polis」など、他の文字列が正しく表示されません。

{:Bsn=>"112511111",
 :Verzekerde=>"VerzekerdeAHM Andes-Faasse",
 :Pakketnaam1=>"Univ\u00E9 Zorg Geregeld Polis",
 :Verzekerdennummer1=>"1234987654",
 :Begindatum1=>"01 jan 2012",
 :Einddatum1=>"\u00A0",
 }

たぶん、このhtmlページのヘッダーが関連している可能性があります。

<!doctype html>
<!-- paulirish.com/2008/conditional-stylesheets-vs-css-hacks-answer-neither/ -->
<!--[if lt IE 7 ]> <html class="no-js ie6" lang="en"> <![endif]-->
<!--[if IE 7 ]>    <html class="no-js ie7" lang="en"> <![endif]-->
<!--[if IE 8 ]>    <html class="no-js ie8" lang="en"> <![endif]-->
<!--[if (gte IE 9)|!(IE)]><!--> <html class="no-js" lang="en"> <!--<![endif]-->
<head id="Head1"><meta charset="utf-8" />

    <!-- Always force latest IE rendering engine (even in intranet)
         Remove this if you use the .htaccess -->
    <meta http-equiv="X-UA-Compatible" content="IE=edge" /><title>
    Verzekeringsrecht controleren
</title><meta http-equiv="cache-control" content="no-cache" /><meta http-equiv="content-language" content="nl-NL" />

utf-8のように継ぎ目がありますが、これらの文字には問題があります。それらを適切にエンコードする方法は?

4

1 に答える 1

1

次に、行は次のようになります:Pakketnaam1=>"Univé Zorg Geregeld Polis",

それはそこにあるはずのものであり、コンソールのエンコーディングが定義されていないため、Ruby は印刷時に Unicode 文字を表示する方法を知らないのでしょうか、それとももう少しテキストが必要ですか?

于 2012-09-18T13:04:34.983 に答える