私は何日もこの問題を抱えています...ページのhtml全体をphpからロードする必要があります。このページには、すべてのページが読み込まれたときに呼び出される jquery 関数があります。この関数は他の html をページにロードするため、すべての html をロードする必要があります (jquery でロードされた部分も)。jqueryからのみロードされたタグを見つけようとして、すべてのページを取得していることがわかります。(例: 名前が XXX のタグ入力、複数属性のタグ入力など)
だから私は試します:
$html = file_get_contents("http://wwww.siteToScrape.com");
if (strpos($html, 'multiple') !== false) {
echo 'found';
} else {
echo 'not found';
}
しかし、結果は「見つかりません」です。
次に、単純な html domをダウンロードして試してみました。
include 'simple_html_dom.php';
$html = file_get_html("http://wwww.siteToScrape.com");
if (strpos($html, 'multiple') !== false) {
echo 'found';
} else {
echo 'not found';
}
しかし、結果はまだ「見つかりません」のままです。
それで、ブラウザをエミュレートするいくつかのphpスクリプトを取得することを考えています(jqueryもロードできます) 。そして、 PHP Scriptable Web Browserをダウンロードして、試してみました:
require_once('browser.php');
$browser = new SimpleBrowser();
$p = $browser->get('http://wwww.siteToScrape.com');
if (strpos($p, 'multiple') !== false) {
echo 'found';
} else {
echo 'not found';
}
しかし、結果はまだ「見つかりません」です。私はそれを行う方法がわからない..誰かが私を助けることができますか??? ありがとう!!!!