0

このトピックについていくつか読んでいますが、適切な情報を見つけることができません.Twitter Streaming、Datasift、その他のデータプッシュサービスなどのサービスを使用しています. 私が理解したかったのは、次のサービスがどのように機能するか、

  1. 毎秒受信されるツイート数は非常に多いです。
  2. 多くの人が接続して、ツイートを受け取りたいキーワードを指定します。これらは複雑なブールクエリになる可能性があります。
  3. これらすべてのブールクエリに対してすべてのツイートをリアルタイムでチェックし、データを適切な接続にストリーミングします。

使用されているアーキテクチャの種類へのポインタは役に立ちます。

4

1 に答える 1

0

まず、理解を深めようとしている Twitter のようなサービスの規模とリソースを理解する必要があると思います!! パフォーマンスは、次の両方の面を管理することで処理できます。

  1. ロード バランサー、複数の Web サーバー、および分散キャッシュを備えた大規模なデータ センターを備えた多層エコシステムを想像してみてください。

  2. アルゴリズムの複雑さに関係なく、アルゴリズムをマルチスレッド化することでパフォーマンスを管理できます!!

本当に理解したい場合は、map-reduce、hadoop などを読んでアイデアを得てください。

于 2013-10-10T07:21:16.123 に答える