hadoop - HBase内部結合およびコプロセッサー

Question

HBaseですべての集約操作を実装するためのプロジェクトを実行することを計画しています。しかし、私はその難しさについて知りません。そのプロジェクトを完了するのにたった6か月しかありません。私はそれを進めるべきですか？私はJavaでそれを行うことを計画しています。すでにいくつかの集計関数があることを知っています。しかし、現在、クエリのような内部結合はありません。私はそのようなタイプのクエリを実装することを計画しています。失態なのかブラフなのかわかりません。

score 1 · Accepted Answer

技術的には、2 つのタイプの結合を区別する必要があると思います。a
) 1 つの小さなテーブル + 1 つの大きなテーブル。小さなテーブルとは、クラスターの操作に深刻な影響を与えることなく、各ノードのメモリにキャッシュできるテーブルを意味します。この場合、小さなテーブルをハッシュマップに配置し、大きなテーブルのデータのノードローカル部分を反復処理し、このようにして結合結果を生成することにより、コプロセッサを使用した結合が可能になるはずです。Hive の用語では、「マップ」と呼ばれます http://www.facebook.com/note.php?note_id=470667928919に参加します。
b) 2 つの大きなテーブル。短期間で製品品質を実現することは現実的ではないと思います。そのような機能は MPP データベースの領域であり、IP の重要な部分であると言えます。

score 0 · Accepted Answer

HBaseでは、RDBMSやPIGやHiveなどの別のHadoopテクノロジーで行うよりも間違いなく困難です。

hadoop - HBase内部結合およびコプロセッサー

2 に答える 2

Related

Reference