2

私のデータは、フレームごとに 1000 万の数値 (実数 + バイナリ) のように見え (配列、つまり配列の行に 1000 万の要素があると考えてください)、約 100 フレーム/秒です。時系列の一種。

私にとっての課題は次のとおりです。

(1) ストレージ - データ量

(2) データの処理速度

(3) リアルタイム分析

カサンドラはこれに適していますか?上記のシナリオで(非常に高いレベルの観点から)うまくいくアプリケーションアーキテクチャ(hadoop、cassandra、kafka、stormなどを考えてください)について、誰かが私を少し案内してもらえますか。

私は何か大きなことを尋ねたことを知っています。実験する前に方向性が必要です。

4

1 に答える 1

2

ストレージ エンジンまたはデータの処理速度として、Cassandra と Hadoop は見事に合格します。

Cassandra は、Hadoop だけでは不十分な場合 (バッチの性質、マップ削減ジョブ)、リアルタイムに近いソリューションを提供できるようになりました。Storm で Hadoop を試すことができます。これにより、ほぼリアルタイムの機能が得られますが、ソリューションの複雑さが増します (スパウトとボルトを使用)。また、いくつかのルール エンジンを試すこともできます。これにより、リアルタイム ソリューションにさらに利点がもたらされます。

于 2013-05-09T06:21:57.033 に答える