setOutputFormat(SequenceFileOutputFormat.class)で構成された100個のレデューサーを使用するジョブがあります。
ジョブの実行後、次のコマンドを使用してすべてのパーツファイルを結合し、圧縮で正しく機能させることはできますか?
hadoop fs -cat output / part *> fullOutput
そうでない場合は、複数のレデューサーを使用して、それらのすべての出力を1つのファイルにまとめるのに適した方法は何ですか?
どうもありがとう、
- 美術