こんにちは私はSimpleHTMLDOMパーサーでUFCイベントのスケジュールをスクレイプしようとしています。
適切なデータを選択するのに苦労しています。
タイトル、画像、日付、時刻、場所が必要です。
これまでに試しました
function scraping_ufc() {
// create HTML DOM
$html = file_get_html('http://uk.ufc.com/schedule/event/');
// get news block
foreach($html->find('table tr') as $event) {
// get title
$item['title'] = trim($event->find('div[class="event-tagline"]', 0)->innertext);
// get details
$item['date'] = trim($event->find('div[class="date"]', 0)->innertext);
$item['time'] = trim($event->find('div[class="time"]', 0)->innertext);
$ret[] = $item;
}
// clean up memory
$html->clear();
unset($html);
return $ret;
}
不要なテーブル行が多数選択されています。タイトルは取得できますが、日付や時刻は取得できません。
必要なデータを効率的に選択するのを手伝ってください。