次の Python スクリプトを使用して、Python から Google Scholar をクロールしました。
import urllib
filehandle = urllib.urlopen('http://www.techyupdates.blogspot.com')
for lines in filehandle.readlines():
print lines
filehandle.close()
しかし、私はそれを繰り返し行っているため、サイトのグーグル学者が次のように言ってブロックされています:
このページは、利用規約に違反していると思われるコンピュータ ネットワークからのリクエストを Google が自動的に検出した場合に表示されます。これらのリクエストが停止するとすぐに、ブロックは期限切れになります。その間、解決....
これを回避する簡単な方法はありますか?助言がありますか?