こんにちは私はhadoopとcassandraの統合にdatastaxエンタープライズを使用しています。3つのcassandraノードと2つの分析ノード(ハイブが実行される)を構成しました。
したがって、ハイブノードではなくcassandraノードに存在するデータがある場合、それはmap reduce中に処理されないか、mapreduceがcassandraノードからデータをプルしてmapreduceを実行するかどうか混乱します。助けてください
だから私は4台のマシンを持っています(レプリケーションファクター3)
machine 1) cassandra node|token value=0 |data owned(25%)
machine 2)-cassandra node|token value=2^127*.5 |data owned(33%)
machine 3)-analytics node|token value=2^127*.25 |data owned(33%)
machine 4) analytics node|token value=2^127*.75 |data owned(8%)
それぞれ25%を所有しているべきではありませんまた、データは3つのノードだけでなくすべてのノードで複製されると思います