1

検索結果ページのソースコードを入手できます。だから私の質問はもっと得る方法についてです。グーグルの場合、私が取得したソースコードの最初の20の画像結果のみが表示されますが、ヤフーの場合は約50です。どちらの場合も、実際の人はページを下にスクロールしてさらに検索結果を表示する必要があるためです。

質問:とにかく、スクリプトで「スクロールダウン」を実行して、より多くの結果を得ることができますか?

私が使用しているコード:

require_once('simple_html_dom.php');
$url = "https://www.google.com/search?tbm=isch&q=cool+image";
$html = file_get_html($url);
foreach($html->find('img') as $element) {


    $image_url = $element->src; 

    echo $image_url, "<br />";}
4

1 に答える 1

1

私自身の質問に答えます。--- |||

Googleは実際には古いバージョンを保持しています。そのバージョンを使用するには、最初に何かを検索してから、一番下までスクロールして[基本バージョンに切り替える]をクリックします。

これで、各ページに20枚の画像のみが表示され、URLにはページパラメータが含まれます。

各ページに20枚の画像が表示されているため、2番目のページのURLには次のパラメータがあります。

start=20

3ページ目は

start=40

このパラメータ:基本バージョンが必要であることをグーグルに伝えるために、URLにsout=1が必要です。

結論として、ページ番号を含む最も単純なGoogle画像検索URLは次のようになります。

$url = "https://www.google.com/search?tbm=isch&sout=1&start=" . ($pageNum -1)*20. "&q="  . $key_word ;
于 2012-12-09T06:48:27.647 に答える