複雑な xml からの画像とテキストの解析に関する以前の質問に加えて、それに関する唯一の問題は、正しいエンコーディングを取得できないことです。テキストはギリシャ語で、xml
ファイルにはutf-8
エンコーディングがあります。これは、xml を解析するコードです。
$xml = simplexml_load_file('myfile.xml');
$descriptions = $xml->xpath('//item/description');
foreach ( $descriptions as $description_node ) {
$description_dom = new DOMDocument();
$description_dom->loadHTML( (string)$description_node );
$description_sxml = simplexml_import_dom( $description_dom );
$imgs = $description_sxml->xpath('//img');
$text = $description_sxml->xpath('//div');
foreach($imgs as $image){
echo (string)$image['src'];
}
foreach($text as $t){
echo (string)$t;
}
}
i の場合echo $description_node
、テキストは問題ないように見えます
が、取得$description_dom
した後は次のようになります
。私は何を間違っていますか?simplexml_import_dom
Ïε ιÏλαμικÎÏ ÎºÎ¿Î¹Î½ÏÏηÏεÏ.
mb_convert_encoding
ýÃÂñù" ÃÂ