私たちはWebスクレイパーを使用しており、ランダム機能が設定されたスリープ機能を持つように設定されています(各スクレイプ間で同じ時間にならないように)が、20〜30回のリクエストの後でもYahooからブロックされています.
制限があるかどうか知っている人はいますか (つまり、1 分あたり 20 リクエスト、1 時間あたり 200 リクエスト) 現在、各リクエスト間の平均は約 3 ~ 6 秒です。助けてくれてありがとう
私たちはWebスクレイパーを使用しており、ランダム機能が設定されたスリープ機能を持つように設定されています(各スクレイプ間で同じ時間にならないように)が、20〜30回のリクエストの後でもYahooからブロックされています.
制限があるかどうか知っている人はいますか (つまり、1 分あたり 20 リクエスト、1 時間あたり 200 リクエスト) 現在、各リクエスト間の平均は約 3 ~ 6 秒です。助けてくれてありがとう
したがって、答えは 5000 クエリです。から撮影
http://forums.digitalpoint.com/showthread.php?t=736784
http://開発者。ヤフー。com/search/rate.html
3 ~ 6 秒ごとに 1 リクエストというのは非常に少ないため、クローラーに別の問題がある可能性があります。
いくつかのアイデア:
Mechanizeのような高レベルのライブラリを使用すると、これはすべて簡単になります。