ノードごとに実行するマップ タスクの数を設定することは可能ですか。
データのクロールに Hadoop ストリーミングを使用しており、ブロックを回避するために必要なマップ タスクはノードごとに 1 つだけです。
ありがとう、
ノードごとに実行するマップ タスクの数を設定することは可能ですか。
データのクロールに Hadoop ストリーミングを使用しており、ブロックを回避するために必要なマップ タスクはノードごとに 1 つだけです。
ありがとう、
ストリーミングの有無に関係なく、mapreduce.tasktracker.map.tasks.maximum
パラメータを使用してノードあたりのマッパーの最大数を設定できます。パラメータはmapred-site.xml
ノードのファイルで設定する必要があります。このプロパティは、クライアントで設定しても効果がありません。
job.xml で次の設定を試してみましたか?
mapred.max.maps.per.node=1
mapred.max.reduces.per.node=1
これらはデフォルトで -1、無制限です (もちろん、利用可能なスロットを除きます)。