私はそのようなHadoopの仕事をしていました。MR には map のみがあり、reduce はありません。そのため、job.setNumReduces(0) を設定します。入力ファイルは約300以上
次にジョブを実行すると、実行中のマップ タスクが 1 つしか表示されません。完了するまでに約 1 時間かかります。次に、結果を確認すると、出力フォルダーに 300 以上の結果ファイルが表示されます。
それは何か問題がありますか?それとも正しいことですか?
Map は、入力ファイルの番号 ( 1 ではありません) と等しくなければならないことを本当に期待しています。出力ファイル番号が入力ファイル番号と同じである理由もわかりません。
Hadoop ジョブは oozie から送信されます。
平素は格別のお引き立てを賜り、誠にありがとうございます。新松