0

特定のクエリの検索結果 (Google の結果ページなど) の数を取得する方法を探しています。目的は、検索 API を使用して正規化された Google 距離 (http://iknowate.blogspot.com/2011/10/google-similarity-distance.html) を実装することです。主な問題は、リクエストの数を制限しすぎないことです (Google API では 1 日あたり最大 100 クエリしか許可されていないようです)。

誰かがこの情報を取得する方法を教えてくれるかもしれません。

4

1 に答える 1

0

サードパーティのライブラリ/クラスを使用して結果ページをスクレイピングし、DOM をトラバースして情報を取得するか、file_get_contents を使用してページを取得してから preg_match を使用して結果の総数を取得できます。別のオプションは、CURL を使用してページをスクレイピングすることです。これにより、複数のエージェントの背後にスクリプトを隠して、ページを複数回スクレイピングする場合にあらゆる種類の禁止を防ぐこともできます。

于 2012-05-27T23:22:49.313 に答える