0

httpc:request を使用して Web サイトから適切にエンコードされた UTF-8 コンテンツを取得するのに問題があります。

私は機能を持っています:

fetch(Url) ->
    httpc:request(get, {Url, [{"User-Agent", ?USERAGENT}]}, [{autoredirect, false}], [{body_format, binary}]).

そして、私はそれを次のように呼び出しています:

fetch("http://chateauvolterra.com").

そのサイトを見ると、宣言された UTF-8 のエンコーディングと、"Château" のようないくつかの Unicode 文字があることがわかります。残念ながら、応答を返すと、外字が文字化けしています。

文字列形式とバイナリ形式の両方で body_format を取得しようとしましたが、どちらにも同じ問題があります。ibrowse ライブラリも試しましたが、同じ問題があるようです。

問題を引き起こす可能性のあるシステム全体のエンコーディング設定はありますか?

ドキュメント内の Unicode 文字を壊さずに HTTP 本文のコンテンツをネットワークから取得するにはどうすればよいですか?

ありがとう!

4

0 に答える 0