0

ヘブライ文字も含む XML がありますが、それを画面に入力すると (Windows の「CAT」)、ギブリッシュが表示されます。そのため、Console2 をインストールし、エンコーディング (chcp) を 862 または 1255 に変更すると、適切に表示されますが、Nokogiri または REXML を使用して解析しようとすると、「不正な形式の xml: 開始タグがありません」という例外がスローされます。 .

したがって、この混乱から抜け出す方法を知っている人がいる場合は、適切な解決策なしで Web 全体を検索するため、どのエンコーディングで何を保存し、この作業を行うかを教えてくれます。

Windows XP 32 ビットを使用しています。私の Ruby IDE は Aptana 3 で、Ruby バージョンは 1.8.7 です。

誰でもここで私を助けてもらえますか?

4

1 に答える 1

1

Ruby 1.8.7 ではエンコーディングに問題があることが知られています。同様の質問がここにあります ( "Encoding in Ruby 1.8.7 or 1.9.2"を参照) 方法を見つけるのに役立つかもしれません。そのため、gemcharacter-encodingsをインストールして、Ruby ファイルでそれを必要とします。次に、処理したい文字列を前に付けますu'myStrüng'(ここでは例としてドイツ語のウムラウトを使用しています)。

于 2011-09-11T07:59:19.390 に答える