0

R の twitteR パッケージを使用して、2012 年 11 月 14 日から 2012 年 11 月 22 日まで (つまり、8 日間) の 2 つの競合するハッシュタグの言及数 (カウント) を比較したいと思います。たとえば、#A と #B の 2 つのハッシュタグを 1 時間ごとに比較したいとします。

これを行うために R で twitteR パッケージを使用する方法があるかどうか疑問に思っています。searchTwitter 関数を使用したもの:

searchTwitter(searchString, n=25, lang=NULL, since=NULL, until=NULL,
              locale=NULL, geocode=NULL, sinceID=NULL, ...)

指定された期間の #A と #B の 1 時間ごとのカウントを比較するだけで、すべてのツイートを取得することに興味はありません。レート制限を認識しておく必要があることはわかっています。レート制限を回避するには、ツイートを巧妙にサンプリングする必要があるかもしれません。これが実現可能かどうかのアイデアと、それをコーディングする方法はありますか?

4

1 に答える 1

1

ハッシュタグごとに 2 分ごとに 100 個のツイートを取得します。#TweetsReturned / (TimePulled - TimeOfOldestTweet) を使用して、単位時間あたりのツイート数の見積もりを取得します。これらをプロットして、経時的なアクティビティの移動平均タイプのグラフを取得できます。2 分あたりのツイート数を計算すると、それらを合計して 1 時間あたりのツイート数を見積もることができます。

于 2012-12-08T14:39:45.567 に答える