Hector のバッチ ミューテーションと、Hadoop ジョブを使用してデータを Cassandra にロードすることの長所と短所を強調してくれる人はいますか?
Hector では、次のようなことができることを知っています。
mutator.addInsertion(...);
mutator.execute();
Hadoop では、MR ジョブを使用してデータを Cassandra にロードできます。
それぞれを使用する理由と使用しない理由を探しています。ありがとう!
データソースが現在hadoop(またはhbase)にない場合は、可動部分の数を抑えるために、上記のようにMutatorを使用するマルチスレッドローダーのみをお勧めします。
この要点は古くなっていますが、アプローチは似ています: https ://gist.github.com/397574
詳細が必要な場合はお知らせください。