0

大規模な静的データセットがあり、それに適用する関数があります。

fはreduce(map(f、dataset))の形式なので、MapReduceスケルトンを使用します。ただし、リクエストごとにデータを分散させたくありません(理想的には、fを高速化するためにインデックス作成を利用したいと思います)。この一般的なケースに対処するMapReduceの実装はありますか?

IterativeMapReduceを調べたところ、おそらくそれでうまくいくかもしれませんが、少し異なるケースに対処しているようで、コードはまだ利用できません。

4

1 に答える 1

0

HadoopのMapReduce(およびGoogleに触発された他のすべてのmap-reduceスケルトン)は、データを常に分散させるわけではありません。

于 2010-02-07T05:40:07.300 に答える