Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
hadoop ( 0.22.0 ) でコンテンツを part-r-00000 part-r-00001 part-r-00002 part-r- 00003 のような異なるファイルに書き出すようにし ます。MultipleOutputs-Class を使用できることはわかっていますが、これでは「部分」句のみを変更できますが、これは私が望むものではありません。どのレデューサーがどの出力ファイルを使用し、最後にどの番号を取得するかを言いたいです。
もちろん、あなたはコントロールを持っています。ジョブが終了したとき (例: job.waitForCompletion(true) の後)。出力パスと使用されたレデューサーの数を知っています。ファイルの名前を変更するだけです。それだけです....より多くのレデューサーを実行するには、パーティショナークラスをホワイトにする必要があります。