-1

私は、約 500 人の異なる Twitter ユーザーのタイムラインを抽出するプロジェクトに取り組んでいます (これを履歴分析に使用しているため、一度だけ取得する必要があります。着信ツイートで更新する必要はありません)。

Twitter API では最新の 3,200 件のツイートしか取得できないことはわかっていますが、R twitteR パッケージの基本的な UserTimeline メソッドを使用すると、試行するたびに約 20 件しか取得できないようです (最近のツイートがかなり多いユーザーの場合)。 )。これはレート制限のためですか、それとも私が何か間違ったことをしているからですか?

これを最も効率的に行うためのヒントはありますか? レート制限のために時間がかかる可能性があることを認識しています.Rでこのプロセスを自動化/反復する方法はありますか?

私はかなり立ち往生しているので、あなたが持っているかもしれない助け/ヒントをどうもありがとう!

(Twitter API/twitteR パッケージを使用して、特定のハッシュタグを使用してツイートを数日間抽出した経験があります。Python で行う方が簡単/迅速であることが判明した場合、基本的な Python のスキルはあります)。

4

1 に答える 1

0

twitteR のドキュメントmaxIDでは、ページネーションに引数を使用することが提案されているようです。したがって、結果の最初のバッチを取得したら、そのセットの最小 ID から 1 を引いた値をmaxID次のリクエストの ID として使用できます。結果が返されなくなるまで (つまり、ユーザーのタイムラインの先頭に到達したことを意味します)。

于 2016-04-12T19:13:37.640 に答える