0

IMO Hadoop は、同じキーをグループ化するだけで CPU とメモリを節約できます

この回答のように、それはですO(n))、

キーを厳密にソートする代わりに(つまりO(nlgn))。

キーが厳密にソートされていることに依存するアプリケーションはありますか?

4

1 に答える 1

1

そうです、Map/Reduce ジョブは必ずしもキーを並べ替える必要はありません。Hadoop がこれを行うのは、主にそれがグループ化に使用されるためであり、必要だからではなく便利だからです。アプリケーションは注文に依存しません。

実際には MAPREDUCE Jiraで議論されています。実装の詳細については、そこにあるすべてのコメントを読むことをお勧めします。

興味深い逸話として、MARS プロジェクトは、独自の実装を使用してソートする代わりに、ハッシュを使用して 45% の向上を報告しました。

于 2013-01-15T07:15:49.453 に答える