データの局所性を含め、CassandraクラスターでMapReduceを実行する必要があります。各ジョブは、ジョブが実行されるローカルのCasandraノードに属する行のみを照会します。
古いCassandraバージョン(0.7)でMR用にHadoopをセットアップする方法に関するチュートリアルがあります。現在のリリースではそのようなものは見つかりません。
この点で0.7から何が変わったのですか?
最小限のセットアップ(Hadoop + HDFS + ...)にはどのソフトウェアモジュールが必要ですか?
Cassandra Enterpriseが必要ですか?