大学のプロジェクトで、いくつかのバックエンド アルゴリズムを使用して Web サイトを作成しています。これらをデモ環境でテストするには、大量の偽のデータが必要です。このデータを取得するために、いくつかのサイトをスクレイピングするつもりです。これらのサイトの 1 つに freelance.com があります。データを抽出するために、Simple HTML DOM パーサーを使用していますが、これまでのところ、必要なデータを実際に取得する試みに成功していません。
これは、スクレイピングしようとしているページの HTML レイアウトの例です。赤いボックスは必要なデータを示しています。
いくつかのチュートリアルに従って、これまでに作成したコードを次に示します。
<?php
include "simple_html_dom.php";
// Create DOM from URL
$html = file_get_html('http://www.freelancer.com/jobs/Website-Design/1/');
//Get all data inside the <tr> of <table id="project_table">
foreach($html->find('table[id=project_table] tr') as $tr) {
foreach($tr->find('td[class=title-col]') as $t) {
//get the inner HTML
$data = $t->outertext;
echo $data;
}
}
?>
どうすればこれを機能させることができるかについて、誰かが私を正しい方向に向けることができれば幸いです。
ありがとう。