以下は私の質問です:
- Hbase は、内部作業で Map/Reduce を使用して Hadoop からデータを抽出しますか?
- HBase は、Amazon dynamo などの他のフレームワークで使用できますか?それとも、ベース フレームワークとして Hadoop を使用する必要がありますか?
- Hbase は習得が容易ですか?
- 練習できる HBase インスタンスをセットアップする最良の方法は何ですか?
その中のセルまたは行にアクセスしようとするとき、HBase は map/reduce を使用しません。基本的に、Hadoop はデータを保存して、キーが見つかった場所を認識できるようにします (キーは辞書順で保存されます)。詳細については、 Lars George によるこの投稿を参照してください。HBase は map/reduce をサポートしているため、作成するジョブのソースまたは宛先として使用できます。
HBase はフレームワークとして Hadoop API を必要としますが、mapr や datastax などの企業は、基礎となる Hadoop フレームワークの代替実装を提供しているため、技術的には、本当に必要な場合はそれを行うこともできます。
何に対して?:) クリシェを使用するには、HBase を習得するのは簡単ですが、マスターするのは難しいと思います。HBase のデータの入出力は非常に迅速に行うことができますが、スキーマを適切に設計し、使用パターンと、先行書き込みログ、圧縮、分割、実行の使用/無効化に与える影響を理解するには時間がかかります。各ノードに複数のリージョン サーバーがあるかどうかなど。
最も簡単な方法は、すでに Hadoop がインストールされている VM をダウンロードすることです。たとえば、これらは Cloudera によって提供されます