hadoop - カサンドラクラスターでハイブを使用してマップリデュース

Question

こんにちは私はhadoopとcassandraの統合にdatastaxエンタープライズを使用しています。3つのcassandraノードと2つの分析ノード（ハイブが実行される）を構成しました。

したがって、ハイブノードではなくcassandraノードに存在するデータがある場合、それはmap reduce中に処理されないか、mapreduceがcassandraノードからデータをプルしてmapreduceを実行するかどうか混乱します。助けてください

だから私は4台のマシンを持っています（レプリケーションファクター3）

machine 1) cassandra node|token value=0         |data owned(25%)
machine 2)-cassandra node|token value=2^127*.5  |data owned(33%)
machine 3)-analytics node|token value=2^127*.25 |data owned(33%)
machine 4) analytics node|token value=2^127*.75 |data owned(8%)

それぞれ25％を所有しているべきではありませんまた、データは3つのノードだけでなくすべてのノードで複製されると思います

score 2 · Accepted Answer

DSEは、データセットの完全なコピーが、分析として指定したノードのセットに複製されることを確認します。したがって、通常は問題になりません。十分な数の分析ノードに障害が発生した場合、データをフェッチするために非分析ノードに移動する必要がある場合があります...ただし、分析ノードをオンラインに戻すことをお勧めします。

hadoop - カサンドラクラスターでハイブを使用してマップリデュース

1 に答える 1

Related

Reference