Linux curl を使用して、URL から xml ファイルをダウンロードしようとしています。
XMLがUTF-8でエンコードされていることを確認してください。
curl -o が UTF-8 として保存されない疑いがあります。
curl で強制的に UTF-8 に保存する方法はありますか?
提案をありがとう、私が見つけたもの:
xml フィードは動的であるため、常に utf-8 文字が含まれているわけではありません。xml エンコーディングとヘッダー コンテンツ タイプで utf-8 として設定されている場合でも、コンテンツ全体に utf-8 文字がまったくない場合があります: charset=utf-8。少なくとも utf-8 文字が含まれている場合は、utf-8 として保存されます。
これが発生すると、curl は utf-8 としてダウンロードされません。これは、utf-8 文字がないため理にかなっています。なぜ utf-8 として保存する必要があるのですか。
これは非常にトリッキーです。一部のバリデーターは utf-8 に対して有効でなければならないため、デフォルトですべての xml shld が utf8 エンコーディングであるため、強制的に utf8 にするソリューションが必要です。
iconv f iso8859-1 utf-8 を使用して提案された方法を試してみましたが、このケースでは機能しません。
まだより良い解決策が必要です。