4

主な質問: Twitter のレート制限により、約 60 万人のユーザーのすべての有向エッジを含む完全なソーシャル ネットワーク グラフを作成するために必要なデータ マイニングを行うことができますか?

これがアイデアです:

ネットワーク内のエッジ/つながり/関係は、フォロワー/フォローされた関係になります。

約 600 人の Twitter ユーザーの特定のリストから始めます。このリストは、大都市のすべての報道機関から選ばれたものです。

600 人のすべてのユーザーについて、すべてのフォロワーとフレンド (フォローしているユーザー) を収集します。これらのユーザーの平均フォロワー数は、おそらくそれぞれ 2,000 人です。おそらく、平均して 500 人の友達 (フォローしている人) がいます。

これらの 600 人のフォロワーはすべて同じ都市にいるため、これらのフォロワーの多くは、これらの 600 人をフォローしている同じユーザーであることが予想されます。この 600 人のユーザーには合計で約 600,000 人のフォロワーと友達がいると推測してみましょう。したがって、これは合計 600,600 人の Twitter ユーザーのサブグラフ/ネットワークになります。

600,000 人のフォロワーと 600 人全員の友達を集めたら、600,600 人全員とそのフォロワーのソーシャル ネットワークを構築できるようにしたいと考えています。これには、少なくともこれらの 600,600 人のユーザーの間ですべての有向エッジを見つけることができる必要があります (これらの 600,600 人のユーザーのそれぞれが互いにフォローしているかどうかに関係なく)。Twitter のレート制限がある場合、この種のデータ マイニングは実行可能でしょうか?

4

2 に答える 2

1

これらの質問に逆の順序で答えます。最初に David Marx から始めます。まあ、私は大量のストレージ容量を備えたかなり堅牢なコンピューター研究センターにアクセスできるので、問題にはなりません。ただし、ソフトウェアがそれを処理できるかどうかはわかりません。

プロジェクトを縮小しなければならない可能性がありますが、それは問題ありません。私にとってのアイデアは、より大きなアイデアから始めて、それがどれくらい大きくなるかを把握し、それに応じて縮小することです.

Anony-Mousse の質問のフォローアップ: 私の問題の一部は、Twitter のレート制限を正しく解釈しているかどうか確信が持てないことです。15 分あたり 15 リクエストなのか、15 分あたり 30 リクエストなのかわかりません。また、1 つのリクエストで 5000 人のフォロワー/フレンドを獲得できると思います。したがって、制限が 15 分あたり 15 リクエストである場合、おそらく 15 分ごとに 75,000 人のフレンドまたはフォロワーを集めることができます。また、あらゆる種類の研究目的でより高いレート制限を要求するプロセスがあるかどうかを把握しようとしています.

ここに制限がリストされています: https://dev.twitter.com/docs/rate-limiting/1.1/limits

于 2013-06-11T05:50:34.657 に答える