Mesos 0.17 で CDH5 に対して Spark 0.9.1 を実行します。これまで、CDH シリーズの「mr1」バージョンを使用し続けてきたので、小さなファイルでfilecrushプロジェクトを実行できました。さまざまな理由から、MR-2 に自由にアップグレードできるようにしたいと考えています。
Hadoop の map/reduce 以外でこれを行うためのツールはありますか? 現在使用している filecrush ライブラリは自明ではないため、パターンを Spark に変換するのは簡単ではありませんでした。