1

数テラバイトの数値データを取得し、1. 最小、2. 最大、3. 合計数の 3 つの質問に答えるシステムを作成する必要があります。

友人は、Hadoop が map-reduce を使用し、reduce ステップが常にデータをソートすることを提案しました。これにより、最小、最大、合計数などの O(n) クエリでも O(nlogn) の複雑さが生じます。

私はインターネットで検索してきました。しかし、私は答えを見つけることができませんでした。誰か助けてくれませんか?私はこの分野に慣れていないので、私の知識不足をご容赦ください。

ありがとう!

4

2 に答える 2