1

約 300 MB のサードパーティ ライブラリを必要とする mapreduce ジョブを実行しています。ジョブの実行時にライブラリをデータ ノードにコピーするコストを回避するため。ジョブの開始前にこれらのライブラリをすべてのデータ ノードに事前展開できる方法/ツールがあるかどうか疑問に思います。

前もって感謝します。

4

1 に答える 1

3

Hadoop の分散キャッシュにデプロイできます。ペレ・フェレーラ・ベルトランはこれをうまく説明しています

于 2012-06-13T09:36:33.510 に答える