1

こんにちは私はhadoopとcassandraの統合にdatastaxエンタープライズを使用しています。3つのcassandraノードと2つの分析ノード(ハイブが実行される)を構成しました。

したがって、ハイブノードではなくcassandraノードに存在するデータがある場合、それはmap reduce中に処理されないか、mapreduceがcassandraノードからデータをプルしてmapreduceを実行するかどうか混乱します。助けてください

だから私は4台のマシンを持っています(レプリケーションファクター3)

machine 1) cassandra node|token value=0         |data owned(25%)
machine 2)-cassandra node|token value=2^127*.5  |data owned(33%)
machine 3)-analytics node|token value=2^127*.25 |data owned(33%)
machine 4) analytics node|token value=2^127*.75 |data owned(8%)

それぞれ25%を所有しているべきではありませんまた、データは3つのノードだけでなくすべてのノードで複製されると思います

4

1 に答える 1

2

DSEは、データセットの完全なコピーが、分析として指定したノードのセットに複製されることを確認します。したがって、通常は問題になりません。十分な数の分析ノードに障害が発生した場合、データをフェッチするために非分析ノードに移動する必要がある場合があります...ただし、分析ノードをオンラインに戻すことをお勧めします。

于 2013-02-24T05:13:28.240 に答える