1

hadoop ( 0.22.0 ) でコンテンツを part-r-00000
part-r-00001
part-r-00002
part-r- 00003 のような異なるファイルに書き出すようにし
ます。MultipleOutputs-Class を使用できることはわかっていますが、これでは「部分」句のみを変更できますが、これは私が望むものではありません。どのレデューサーがどの出力ファイルを使用し、最後にどの番号を取得するかを言いたいです。

4

1 に答える 1

1

もちろん、あなたはコントロールを持っています。ジョブが終了したとき (例: job.waitForCompletion(true) の後)。出力パスと使用されたレデューサーの数を知っています。ファイルの名前を変更するだけです。それだけです....より多くのレデューサーを実行するには、パーティショナークラスをホワイトにする必要があります。

于 2013-03-03T20:07:17.570 に答える