java - Cassandra ノードのローカルデータにアクセスする方法

Question

私が Cassandra についてほとんど理解していないことから、データの局所性は、ノードにアクセスするクライアントアプリケーションに対してほとんど透過的であるように思われます。

しかし、接続しているノードに対してローカルな列ファミリーのデータのみに明示的にアクセスしたい場合はどうすればよいでしょうか? そのようなことは可能ですか？すぐに使用できるクライアント API からこれを取得する方法は見つかりませんでしたが、システムテーブルを介してこの情報の一部を取得できたようですが、これを行う方法がよくわかりません。 .

アイデアは mapreduce を実行することですが、Hadoop は使用しません。ローカルクライアントは、ローカルの cassandra ノードに接続し、ローカルデータの集計を実行してから、上流に戻します。

そのようなことはまったく可能ですか？Hadoop が Cassandra を使用できるという証拠を見たので、一見可能のように見えますが、例は一般的なクライアントではなく Hadoop を対象としているようです。ローカルクライアント (Casandra との会話) は Java になります。現在 Hector を使用していますが、データの局所性情報が提供されるかどうかはわかりません。

score 2 · Accepted Answer

Netflix Techblogの最近の記事で Aegisthus が紹介されています。これは、ディスクに保存されている SSTable をクラスター全体で読み取り、それらを (MapReduce で) 単一の一貫したデータビューにマージするプロジェクトです。その場合、単一ノードでデータのビューを生成するためのメカニズムが自明に存在すると想像できます。

残念ながら、彼らはまだこのツールをオープンソース化していないと思いますので、あなたはそれを使うことができません. この時点で可能なことは、Cassandra 以外のコードを使用して SSTable をネイティブに読み取ることができるということです。

SSTables を読み取る Cassandra ソースを使用して何かを一緒にハックし、それを構築したいローカルクライアントに供給することができるかもしれません。優れた出発点は、ツールorg.apache.cassandra.tools.SSTableExportで使用されているソースを調べることです。sstable2json

java - Cassandra ノードのローカル データにアクセスする方法

1 に答える 1

Related

Reference

java - Cassandra ノードのローカルデータにアクセスする方法