Wordpress のエクスポート機能から生成された XML ファイルを解析しようとしています。ブロックからテキストを取得しましたが、テキストをエコーすると、不正な形式になり、ASCII になると思います。
<?php
header("Content-Type: text/plain; charset: UTF-8;");
$source = file_get_contents("blog.wordpress.2013-10-31.xml");
$xml = simplexml_load_string($source);
$items = $xml->channel->item;
foreach($items as $item) {
$namepsaces = $item->getNameSpaces(true);
$content = $item->children($namepsaces['content']);
if($content != '') {
echo '#' . $item->title . "#\n";
echo $content->encoded;
echo "\n\n\n";
}
}
そうAs the BBC’s
なるでしょうAs the BBC’s
。とにかく、私はこれを止めることができますか?
編集: echo '“Test”' を追加しました。ヘッダーの直後に変更すると、ブラウザーに「Test」と表示されるので、これは SimpleXML の問題ではないようです。