私はアキュムロを初めて使用します。Hadoop と MapReduce を使用して、データをスキャン、挿入、更新、および削除する Java コードを記述できることを知っています。知りたいのはAccumuloで集計ができるかどうかです。
MySqlでは、、、、、、、、s、ネストされたクエリなどを使用できることを知っていますgroupby
.Accumuloでこれらの関数を直接または間接的に使用する可能性はありますか.orderby
max
min
count
sum
join
私はアキュムロを初めて使用します。Hadoop と MapReduce を使用して、データをスキャン、挿入、更新、および削除する Java コードを記述できることを知っています。知りたいのはAccumuloで集計ができるかどうかです。
MySqlでは、、、、、、、、s、ネストされたクエリなどを使用できることを知っていますgroupby
.Accumuloでこれらの関数を直接または間接的に使用する可能性はありますか.orderby
max
min
count
sum
join
Accumulo は、コンバイナー反復子 ( Accumulo Combiner Example )を使用して集約をサポートします。
イテレータは主にサーバー側で実行されますが、クライアント側で実行することもでき、データをクライアントに送り返す前にかなりの計算を実行できます。
Accumulo には多くのイテレータが同梱されています。より具体的には、エントリの値を合計するために summingCombiner が使用されます。Dave Medinet のブログには、いくつかの良い例があります ( Accumulo ブログ)。より具体的には、 summingCombiner を使用して wordcount ( Accumulo のWord Count ) を実装します。また、Accumulo ユーザーのメーリング リスト (メーリング リスト) にサインアップすることをお勧めします。
Accumulo には優れた集計機能があると思います。40 のノードで数億のキーを使用して OLAP ソリューションを実行しています。基本的な SummingCombiner に加えて、新しい statscombiner もお勧めします
これにより、一連のキーに関する基本的な統計が得られます。
コンバイナーは、メジャー圧縮、マイナー圧縮、またはスキャン時に設定できます。たくさんの細流化されたキーを含む大量のデータがある場合、スキャン時間の組み合わせはお勧めしません。スキャン時間が遅くなる可能性があるためです (常にではありません)。
HTH