私の目標は、アイルランド、ニュージーランド、リトアニアなどの特定の小さな国から発信されたすべてのツイート、または可能な限り多くのツイートを取得することです。
Twitter の検索 API を使用すると、特定の緯度/経度を中心とした半径でステータスを検索できます。Twitter は、ユーザーのプロファイルに含まれるジオタグ データによって、またはプロファイル内のユーザーの出身地を逆ジオコーディングすることによって、返す結果を決定します。
ストリーミング API のパブリック ステータス ストリームはジオボックスでフィルタリングできますが、Twitter はこれらの結果を返すときにリバース ジオコーディングを実行しません。これまでの調査によると、これらの国ではジオタグを使用している人はほとんどいません。
明らかに、ファイアホース ストリームにアクセスできる場合は、逆ジオコーディングを自分で実行できるため、ストリーミング API を使用することをお勧めします。ただし、デフォルトのアクセス レベルでは、ランダム サンプル ストリームでは十分な関連ユーザーが得られません。
では、ストリーミング API を使用することで得られるメリットがあるとすれば、それは何ですか? ストリーミング API から一意のデータを取得する可能性は低いため、単純に検索 API に固執する必要がありますか?