1

単一のファイルに対して繰り返し実行されるHadoopジョブがあります。これで、ディレクトリ内のファイルごとに複数のジョブを並行して実行する必要がある場合、HADOOPで休止するためのベストプラクティスは何ですか。

4

1 に答える 1

0

反復マップ削減に対処するプロジェクトhaloopを参照できます。次に、ファイルが大きい場合は、haloop を使用します。そうでない場合は、小さなファイルを組み合わせてパフォーマンスを向上させることができます。

于 2012-12-13T14:36:46.117 に答える