XpathでWebスクレイピングを学ぼうとしています。以下のコードは機能しますが、出力に間違った文字が含まれているため、これを正しく行うことができません。
例:
- 出力: エメジェリエ
- あるべき姿: Emåmejeriet
PHP コード:
<?php
// Tried with these parameters but they doesn't make any difference
$html = new DOMDocument('1.0', 'UTF-8');
$html->loadHtmlFile('http://thesite.com/thedoc.html);
$xpath = new DOMXPath($html);
$nodelist = $xpath->query("//table");
foreach ($nodelist as $n) {
echo $n->nodeValue."\n";
}
?>
これを修正するにはどうすればよいですか?