11

Druid よりも Cassandra が効果的に対応できるユースケースは多くないと思わずにはいられません。時系列ストアまたはキー値として、Druid でクエリを記述して、必要に応じてデータを抽出できます。ここでの議論は、カサンドラよりもドルイドを正当化することに関連しています。

Cassandra の高速書き込み以外に、他に何かありますか? 特に、Druid のリアルタイム集計/およびクエリ機能を考えると、Cassandra に勝るものはありません。

答えられるより率直な質問については、Druid は Cassandra と比較して機能のスーパーセットを提供していないので、Druid をすぐに使用したほうがよいのではないでしょうか? すべてのユースケースで?

4

3 に答える 3

20

答えられるより率直な質問については、Druid は Cassandra と比較して機能のスーパーセットを提供していないので、Druid をすぐに使用したほうがよいのではないでしょうか? すべてのユースケースで?

まったく、それらは比較できません。ここでは、2 つの非常に異なるテクノロジについて説明します。簡単な方法は、Cassandra を分散ストレージ ソリューションと見なすことですが、Druid を分散アグリゲーター (つまり、すばらしいオープン ソースの OLAP のようなツール (: )) と見なすことです。 cassandra の焦点では​​ないデータ マイニングの世界で 2 つのプロジェクトを比較します。

Druid はポイント ルックアップがまったく得意ではありません。時系列が大好きで、そのパーティショニングは主に日付ベースのセグメントに基づいています (たとえば、サイズに基づいてシャード化される可能性のある時間単位/月単位などのセグメント)。

Druid は、数値である事前定義されたアグリゲーターに基づいてデータを事前に集計します (たとえば、Web サイトのクリック イベント数を 1 日単位で合計するなど)。別の文字列または正確な数字を言うために文字列からのキー検索を保存したい場合、Druid は探すことができる最悪のソリューションです。

于 2015-03-01T23:55:21.580 に答える
10

これが本当にSOタイプの質問かどうかはわかりませんが、簡単な答えは、ユースケースの問題だということです. 簡単に言えば、Druid は、リアルタイムで取り込まれたデータへの非常に高速なアドホック クエリを容易にするときに真価を発揮します。読み取りの一貫性が保たれ、事前に計算されたクエリによって速度が制限されることはありません。一方、保持しているデータに書き込むことはできず、上書きのみが可能です。

Cassandra (私が読んだことによると、使用していません) は、書き込みをサポートし、事前計算を非常にうまく処理する、最終的に一貫性のあるデータ ストアです。同じデータへのアドホック クエリへのリアルタイム アクセスを提供しながら、継続的にデータを取り込むことは意図されていません。

実際、planetcassandra.org の「Druid Real-Time Analytics Engine のディープ ストレージ メカニズムとしての Cassandra!」で提案されているように、この 2 つを連携させることができます。.

于 2015-01-07T19:03:01.660 に答える