私が Cassandra についてほとんど理解していないことから、データの局所性は、ノードにアクセスするクライアント アプリケーションに対してほとんど透過的であるように思われます。
しかし、接続しているノードに対してローカルな列ファミリーのデータのみに明示的にアクセスしたい場合はどうすればよいでしょうか? そのようなことは可能ですか?すぐに使用できるクライアント API からこれを取得する方法は見つかりませんでしたが、システム テーブルを介してこの情報の一部を取得できたようですが、これを行う方法がよくわかりません。 .
アイデアは mapreduce を実行することですが、Hadoop は使用しません。ローカル クライアントは、ローカルの cassandra ノードに接続し、ローカル データの集計を実行してから、上流に戻します。
そのようなことはまったく可能ですか?Hadoop が Cassandra を使用できるという証拠を見たので、一見可能のように見えますが、例は一般的なクライアントではなく Hadoop を対象としているようです。ローカル クライアント (Casandra との会話) は Java になります。現在 Hector を使用していますが、データの局所性情報が提供されるかどうかはわかりません。