ユーザーがランダムなキーワードを入力して、Google.com で検索したときにそのキーワードが生成するヒット数を返すことができるhtml/javascript/PHPベースのWeb アプリケーションを作成しています。
これはさまざまなアプローチで実現できることはわかっていますが、私が望むのは、これを行う最も簡単な方法です。
たとえば2%の限界誤差を許容することを選択した場合、ここで最善のアプローチは何だと思いますか? サンプルコードを見せていただけますか?
アプローチ 1: スクリーン スクレイピング
PHPを使用してfile_get_contents
、このように
$keyword = "Football";
$html = file_get_contents("http://www.google.com/?q=" . rawurlencode($keyword));
preg_match('/Results: - \d+ of about ([0-9,]+) for/', $html, $reg);
var_dump($reg[1]);
しかし、それは私にとってはうまくいきません。これはGoogleの利用規約に違反すると思いますか?その意味は何ですか?
アプローチ 2: Google Ajax API
Google Ajax API とestimatedResultsCount
JSON のプロパティを使用します。これを実際に行う方法がよくわからないので、これがより良いアプローチであると主張する場合は、アイデアを得るためにサンプルコードを提供していただけますか?
他のアプローチ?ここで私が本当に探しているのは、使用するテクニックとその使用方法に対する具体的でより正確な回答です。繰り返しますが、わかりやすくするためにサンプルコードも提供してください。