Tweepy を使用して ~27,000 人のユーザーからツイートをダウンロードしています。3 日前にスクリプトを実行しましたが、何時間も問題なく実行されました。ユーザーのタイムラインへの呼び出しにリツイートを含めるのを忘れていたため、実行を 2 日間停止し、再起動するときに小さな部分を追加する必要がありました。
ただし、実行すると、ランダムな時間実行されます(3ユーザーの場合もあれば、100ユーザー以上の場合もあります)。毎回、ある時点で次のように言います。
[Errno 8] nodename nor servname provided, or not known
何が原因なのかわかりません。それをグーグルで検索すると、他のライブラリから大量のものが見つかりますが、Tweepy に関連するものは何もありません。これは単なるネットワークの問題 (接続の切断) ですか、それとも Tweepy に何か問題がありますか?
CONSUMER_KEY = '**'
CONSUMER_SECRET = '**'
ACCESS_KEY = '**'
ACCESS_SECRET = '**'
auth = tweepy.OAuthHandler(CONSUMER_KEY, CONSUMER_SECRET)
auth.set_access_token(ACCESS_KEY, ACCESS_SECRET)
api = tweepy.API(auth)
bill_authors = [id1, id2, id3, ...]
for author in bill_authors:
try:
for status in tweepy.Cursor(api.user_timeline, id=author, include_rts=True).items():
lowerb = datetime.datetime(2012, 8, 26, 0, 1)
upperb = datetime.datetime(2012, 8, 30, 0, 1)
if status.created_at >= lowerb and status.created_at <= upperb:
print '%s - %s - %s - %s' % (status.id, status.created_at, author, status.text)
if status.created_at < lowerb:
break
except tweepy.TweepError, e:
print 'Error! %s' % (e)