-2

こんにちは、スクリーンスクレイピングは初めてです。ホテル予約ウェブサイトからレビューをスクレイピングして、私のサイトに表示しようとしています..

ここまでたどり着きましたが、少し行き詰まりました。誰でも助けることができますか?

<?php 
$data = file_get_contents('http://www.laterooms.com/en/hotel-reviews/238902_the-westfield-bb-sandown.aspx');
$regex = '/<div id="summary">
(.+?)</div>/';
preg_match($regex,$data,$match);
var_dump($match); 
echo $match[1];
?>
4

1 に答える 1

1

DomDocumentを使用する

<?php
  define('URL', 'http://www.laterooms.com/en/hotel-reviews/238902_the-westfield-bb-sandown.aspx');
  $doc = new DOMDocument();
  $doc->loadHTML(file_get_contents(URL));
  $summary = $doc->getElementById('summary');
  // also have $doc->getElementsByTagName , etc
  var_export($summary);
?>

また、より複雑なクエリについては、 XPATHを調べることを検討する必要があります(jQuery のような構文を使用します)。

于 2012-08-14T14:50:05.240 に答える