現在、次の列を持つ取引のリストがあります。
TradeID, SellerID, FishType, Price, Qty
私は得るために探しています
- 各SellerIDの数
- 各FishTypeの数量
現在、各FishTypeのQtyを合計するために< FishType , Qty > を出力するマッパーを作成しました。ただし、SellerIDのカウントを取得するには、別の mapreduce タスクを作成する必要がありますか? または、同じ mapreduce タスク内でこれを行う方法はありますか?
カウンターの使用を検討しましたが、コーディングの時点ではレコード内の SellerID が不明であり、カウンターを使用して追跡するには数が多すぎる可能性があります。私の意見では、これはカウンター機能の悪用でもあります。
ご意見をお聞かせください。