このコードを使用して、Web サイトから特定のデータをスクレイピングしています。
<!DOCTYPE html>
<head>
<meta http-equiv="content-type" content="text/html; charset=utf-8">
<title>scrap</title>
</head>
<body>
<?php
$url = 'http://xn--mgbaam1d9c.com';
$html = file_get_contents( $url);
libxml_use_internal_errors( true);
$doc = new DOMDocument;
$doc->loadHTML( $html);
$xpath = new DOMXpath( $doc);
// A name attribute on a <div>???
$node = $xpath->query( '//div[@class="list"]')->item( 0);
echo $node->textContent;
?>
</body>
</html>
非常にうまく機能しているが、スクレイピング
- 結果には1つの結果しか表示されません。すべての結果を表示したいです(Webサイトにはページネーションがあります)。
- 結果はアラビア語で表示され、下の画像のように表示されます - http://i.stack.imgur.com/Z9VMn.png
では、すべての結果を取得してアラビア語で表示するにはどうすればよいですか。
前もって感謝します。