大きなデータセットを効率的に並べ替えたいのですが(つまり、ここで説明するように、カスタムパーティショナーを使用して:MapReduceの並べ替えアルゴリズムはどのように機能しますか?)、ハイブを使用して並べ替えます。
ただし、Hiveのマニュアルには、「orderby」は単一のレデューサーによって実行されると記載されています。pigは記事に似たものを実装しているので、これは私を驚かせます-pig impl
私は何かが足りないのですか、それともハイブがこの仕事に適したハンマーではないのですか?