map-and-reduceモデルで実行するのに非常に適した高価なジョブがあります(簡単に言うと、時間のかかるアルゴリズムを使用して以前に計算された数百のランキングを集約することです)。
私は(単なるマルチプロセッシングではなく)クラスター上でジョブを並列化することを望み、CeleryとDiscoの2つの実装に焦点を合わせました。Celeryは、すぐに使用できる単純なmap-and-reduceをサポートしていません。「マップ」部分は、TaskSetsを使用して簡単に実行できますが、「reduce」部分を効率的に実装するにはどうすればよいですか。
(ディスコに関する私の問題は、Windowsで実行されないことです。また、プログラムの別の部分にセロリをセットアップしているため、map-reduce用に別のフレームワークを実行するのはかなりエレガントではないようです。)