accumulo - Accumulo は集計をサポートしていますか?

Question

私はアキュムロを初めて使用します。Hadoop と MapReduce を使用して、データをスキャン、挿入、更新、および削除する Java コードを記述できることを知っています。知りたいのはAccumuloで集計ができるかどうかです。

MySqlでは、、、、、、、、s、ネストされたクエリなどを使用できることを知っていますgroupby.Accumuloでこれらの関数を直接または間接的に使用する可能性はありますか.orderbymaxmincountsumjoin

score 4 · Accepted Answer

Accumulo は、コンバイナー反復子 ( Accumulo Combiner Example )を使用して集約をサポートします。

イテレータは主にサーバー側で実行されますが、クライアント側で実行することもでき、データをクライアントに送り返す前にかなりの計算を実行できます。

Accumulo には多くのイテレータが同梱されています。より具体的には、エントリの値を合計するために summingCombiner が使用されます。Dave Medinet のブログには、いくつかの良い例があります ( Accumulo ブログ)。より具体的には、 summingCombiner を使用して wordcount ( Accumulo のWord Count ) を実装します。また、Accumulo ユーザーのメーリングリスト (メーリングリスト) にサインアップすることをお勧めします。

score 0 · Accepted Answer

Accumulo には優れた集計機能があると思います。40 のノードで数億のキーを使用して OLAP ソリューションを実行しています。基本的な SummingCombiner に加えて、新しい statscombiner もお勧めします

http://accumulo.apache.org/1.4/apidocs/org/apache/accumulo/examples/simple/combiner/StatsCombiner.html

これにより、一連のキーに関する基本的な統計が得られます。

コンバイナーは、メジャー圧縮、マイナー圧縮、またはスキャン時に設定できます。たくさんの細流化されたキーを含む大量のデータがある場合、スキャン時間の組み合わせはお勧めしません。スキャン時間が遅くなる可能性があるためです (常にではありません)。

HTH

accumulo - Accumulo は集計をサポートしていますか?

4 に答える 4

Related

Reference