0

GoogleScholarからデータを抽出する必要があるプロジェクトに取り組んでいます。私のPHPプログラムは、ローカルマシンから文字列を取得し、それをGoogle Scholarに渡し、検索結果ページで最初の結果を取り出してデータベースに保存します。

私はこれをほぼ9万の文字列/クエリに対して実行する必要があります。問題は、数百のエントリの後、Google Scholarがキャプチャの検証を要求すると、プログラムが停止することです。私はそれについて何ができますか?

4

1 に答える 1

1

Google Scholar には API がないため、必要なことを行うための文書化された方法はありません。このようにデータをスクレイピングすることは想定されていません。そのため、Google のボット保護機能に遭遇しています。唯一の現実的な選択肢は、Google が API を作成するのを待つことだと思います。

于 2011-05-30T21:05:08.643 に答える