PyGithub 経由で Github からデータをスクレイピングしています。私の問題は、スクレイピング中に次のエラーが表示されることです。
github.GithubException.GithubException: 403 {'documentation_url': ' https://developer.github.com/v3/#rate-limiting ', 'メッセージ': 'XXXXX の API レート制限を超えました。'}
私が受け取るAPIをカールすると:
curl -i https://api.github.com/users/XXXXXX
HTTP/1.1 200 OK
Server: GitHub.com
Date: Thu, 14 Jul 2016 15:03:51 GMT
Content-Type: application/json; charset=utf-8
Content-Length: 1301
Status: 200 OK
X-RateLimit-Limit: 60
X-RateLimit-Remaining: 52
X-RateLimit-Reset: 1468509718
Cache-Control: public, max-age=60, s-maxage=60
Vary: Accept
Last-Modified: Wed, 08 Jun 2016 13:29:08 GMT
Ratelimit ラベルに注意してください。
X-RateLimit-Limit: 60
X-RateLimit-Remaining: 52
X-RateLimit-Reset: 1468509718
Python プログラムを再度実行すると、別の API レート制限を超えたというメッセージが表示されます。私は github の API ドキュメントを読みましたが、私が知る限り、まだ 52 個のリクエストが残っています。これを改善するためにこれ以上情報を提供できる場合は、お知らせください。ありがとうございました。
編集:明確にするために、資格情報を使用してgithubにログインしています。
ORGANIZATION = "ORG"
PERSONAL_ACCESS_TOKEN = "TOKEN"
g = Github(PERSONAL_ACCESS_TOKEN, per_page = 100)
github_organization = g.get_organization(ORGANIZATION)