だから私はサブredditsのリストを持っていて、それらを開くためにurllibを使用しています。それらを調べてみると、最終的に urllib は次のように失敗します。
urllib2.HTTPError: HTTP Error 429: Unknown
いくつかの調査を行ったところ、reddit はサーバーへのリクエストの量を IP で制限していることがわかりました。
リクエストは 2 秒ごとに 1 つまでにしてください。リクエストのバーストにはある程度の許容範囲がありますが、それを正常に保ちます。一般に、1 分間に 30 件を超えないようにしてください。
そこでtime.sleep()
、リクエストを 10 秒ごとに 1 ページに制限することにしました。これも同様に失敗します。
上記の引用は、reddit APIページから取得したものです。reddit API は使用していません。この時点で、私は2つのことを考えています。その制限が reddit API にのみ適用されるか、urllib にも制限があります。
この2つのうちどちらかわかる方いますか?または、どうすればこの問題を回避できますか?