mongodb - 完全なファイアホースストリームでの Mongo/Redis の使用

翻译自：https://stackoverflow.com/questions/14819507 2013-02-11T19:35:06.717

228 次

私は、DataSift がさまざまなテクノロジーを使用して Twitter ファイアホースを消費する方法について調べてきました。同じ概念に従う必要があるため、mongo/redis とリアルタイムデータのストレージでの使用の違いについて理解を深めたいと考えていました。私の理解は次のとおりです。たとえば、rabbitmq キューの束に単純にデータ (ツイートなど) を消費して配置するには、ストリームボリュームが多すぎます。私の懸念は、データ損失の問題です。私の現在のアーキテクチャでは、オープンストリームに接続してデータを消費し、各投稿またはメッセージを rabbitmq のいくつかのキューにプッシュします。キューには、各メッセージのコピーが保持されます。1 つは処理キュー、もう 1 つはストレージキューです。

私のボリュームが 100 倍に増加した場合、この現在の設定ではボリュームを処理できず、mongo/redis アプローチを使用する方がよいと言われます。したがって、これがどのように実装されるかはわかりません。次に、ストリームをmongoに消費し、そこからキューに消費しますか?なぜこれがより良いアプローチになるのでしょうか.

mongodb - 完全なファイアホース ストリームでの Mongo/Redis の使用

0 に答える 0

Related

Reference

mongodb - 完全なファイアホースストリームでの Mongo/Redis の使用