編集: 100 個のノードがある場合、単一のノードから get_range_slices を実行することは決してないので、元の質問を理解しているかどうかはわかりません。通常、すべてのキーを並行して処理できるように、cassandra のアダプターを使用して cassandra の上に hadoop map/reduce をインストールします。
get_range_slices は一般に、ランダム パーティショナーで「すべて」のキーを取得するために使用されることはありません。代わりに、バイナリコードを各マシンに送信する方がはるかに高速であり、各マシンが並行して実行されるため、マップ/リデュースが利用されるため、データセット全体をはるかに高速にトラバースできます。
すなわち。get_range_slices の代わりに map/reduce を調べる必要があるのではないでしょうか?
別のオプションは、ストームを使用でき、各パーティションを処理するマシンを持つことができるため、PlayOrm を使用する場合は PlayOrm のパーティショニングです。そして、あなたはすることができます
PARTITIONS(:partitionId) SELECT * FROM Table
パーティションのすべての行を取得します。
もちろん、結合なども実行できます。それらは複数のディスクから並行して読み取り、ディスクを処理するため高速です。その並行アクションで処理を高速化する必要があります。