主な質問: Twitter のレート制限により、約 60 万人のユーザーのすべての有向エッジを含む完全なソーシャル ネットワーク グラフを作成するために必要なデータ マイニングを行うことができますか?
これがアイデアです:
ネットワーク内のエッジ/つながり/関係は、フォロワー/フォローされた関係になります。
約 600 人の Twitter ユーザーの特定のリストから始めます。このリストは、大都市のすべての報道機関から選ばれたものです。
600 人のすべてのユーザーについて、すべてのフォロワーとフレンド (フォローしているユーザー) を収集します。これらのユーザーの平均フォロワー数は、おそらくそれぞれ 2,000 人です。おそらく、平均して 500 人の友達 (フォローしている人) がいます。
これらの 600 人のフォロワーはすべて同じ都市にいるため、これらのフォロワーの多くは、これらの 600 人をフォローしている同じユーザーであることが予想されます。この 600 人のユーザーには合計で約 600,000 人のフォロワーと友達がいると推測してみましょう。したがって、これは合計 600,600 人の Twitter ユーザーのサブグラフ/ネットワークになります。
600,000 人のフォロワーと 600 人全員の友達を集めたら、600,600 人全員とそのフォロワーのソーシャル ネットワークを構築できるようにしたいと考えています。これには、少なくともこれらの 600,600 人のユーザーの間ですべての有向エッジを見つけることができる必要があります (これらの 600,600 人のユーザーのそれぞれが互いにフォローしているかどうかに関係なく)。Twitter のレート制限がある場合、この種のデータ マイニングは実行可能でしょうか?