私は 4 つの MapReduce ステップを持つプログラムを使用しています。最初のステップの出力は次のとおりです。
id value
1 20
2 3
3 9
4 36
約 1,000,000 個の ID があり、2 番目のステップで値を並べ替える必要があります。このステップの出力:
id value
4 36
1 20
3 9
2 3
map reduce でデータを並べ替えるにはどうすればよいですか? テラソートを使用する必要がありますか? はいの場合、プログラムの 2 番目のステップでテラソートを使用するにはどうすればよいですか? ありがとう。