この質問には、「正しい」答えは1つもありません。
クラスター上でテラバイトのデータに対してMapReduceアルゴリズムを実行することに興味があります。
上記のアルゴリズムの実行時間についてもっと知りたいです。
どんな本を読むべきですか?
MapReduceクラスターのセットアップや標準アルゴリズムの実行には興味がありません。厳密な理論的処理または実行時間が必要です。
編集:問題は、マップが変更の実行時間を短縮することではありません。問題は、ほとんどのアルゴリズムがマップリデュースフレームワークにうまく分散しないことです。マップリデュースフレームワークで実行されるアルゴリズムに興味があります。