httpc:request を使用して Web サイトから適切にエンコードされた UTF-8 コンテンツを取得するのに問題があります。
私は機能を持っています:
fetch(Url) ->
httpc:request(get, {Url, [{"User-Agent", ?USERAGENT}]}, [{autoredirect, false}], [{body_format, binary}]).
そして、私はそれを次のように呼び出しています:
fetch("http://chateauvolterra.com").
そのサイトを見ると、宣言された UTF-8 のエンコーディングと、"Château" のようないくつかの Unicode 文字があることがわかります。残念ながら、応答を返すと、外字が文字化けしています。
文字列形式とバイナリ形式の両方で body_format を取得しようとしましたが、どちらにも同じ問題があります。ibrowse ライブラリも試しましたが、同じ問題があるようです。
問題を引き起こす可能性のあるシステム全体のエンコーディング設定はありますか?
ドキュメント内の Unicode 文字を壊さずに HTTP 本文のコンテンツをネットワークから取得するにはどうすればよいですか?
ありがとう!