libcurl を使用して HTML ページを取得しています。
HTML ページには、次のような文字参照が含まれています。סלקום
libxml2 を使用してこれを読むと、次のようになります。
ISO-8859-1エンコーディングですか?
もしそうなら、それをUTF-8に変換して正しい単語を取得するにはどうすればよいですか?
ありがとう
編集:私は解決策を得ました.MSaltersは正しかった.libxml2はUTF-8を使用しています.
これをeclipse.iniに追加しました
-Dfile.encoding=utf-8
最後に、Eclipse コンソールでヘブライ文字を取得しました。ありがとう