2

私は二次的な並べ替えの問題を扱っています。値が NullWritable になる可能性があるため、以下のデータを検討してください。

 Composite key 
    2000 250     
    2000 150
    2000 90

    2001 100
    2001 80

    2002 500
    2002 120

私の複合キーは、年(昇順)と学生数(降順)で構成されています。したがって、キーを年ごとにグループ化すると、読んだ内容によると、レデューサーでは、コンポジットの2番目の部分が降順でソートされるため、出力で各年の最大値を取得する必要があります。キーのどの部分がレデューサーに送信されるか、またはグループ化がどのように行われるかがわからないため、この背後にあるロジックがわかりません。

4

3 に答える 3

0

グループ化キーは、reduce メソッドが一度に呼び出されるキーの部分を決定します。

于 2013-09-30T09:34:55.620 に答える