画像から IPTC データを読み取る場合、PHP 経由で読み取ったときに UTF-8 アクセント付き文字が正しく表示されません。
例: é、ø、ü
ヘッダーの content-type を文字ではなく UTF8 に設定すると、黒いひし形にクエスチョン マークが表示されます。� content-type が設定されていない場合、ダッシュ文字が表示されます: —</p>
以下は、IPTC ブロックを読み取るために使用されているコードです。
$file = '/path/to/image.jpg';
getimagesize($file, $info);
$iptc = iptcparse($info['APP13']);
また、まったく同じ画像を同じサーバー上の WordPress インストールにアップロードしようとしましたが、アクセント付きの文字が適切に削除され、基本的なラテン文字に置き換えられます。これが最終結果であってもかまいませんが、文字を正しく読みたいだけです。
画像から完全で正しいデータを取得する方法についてのアイデアはありますか?