大規模な静的データセットがあり、それに適用する関数があります。
fはreduce(map(f、dataset))の形式なので、MapReduceスケルトンを使用します。ただし、リクエストごとにデータを分散させたくありません(理想的には、fを高速化するためにインデックス作成を利用したいと思います)。この一般的なケースに対処するMapReduceの実装はありますか?
IterativeMapReduceを調べたところ、おそらくそれでうまくいくかもしれませんが、少し異なるケースに対処しているようで、コードはまだ利用できません。