このトピックについていくつか読んでいますが、適切な情報を見つけることができません.Twitter Streaming、Datasift、その他のデータプッシュサービスなどのサービスを使用しています. 私が理解したかったのは、次のサービスがどのように機能するか、
- 毎秒受信されるツイート数は非常に多いです。
- 多くの人が接続して、ツイートを受け取りたいキーワードを指定します。これらは複雑なブールクエリになる可能性があります。
- これらすべてのブールクエリに対してすべてのツイートをリアルタイムでチェックし、データを適切な接続にストリーミングします。
使用されているアーキテクチャの種類へのポインタは役に立ちます。