3

最近、私が実行しているすべての Hadoop フローで、特定のマップ ノード (スレーブとして動作するマスター) で 3 分 10 秒の遅延が発生します。その初期化遅延の後、通常に戻り、即座に実行されます。

たとえば、QuasiMonteCarlo の例を実行する場合:

Task Id                                 Start Time  Finish Time <br>
attempt_201204101957_0006_m_000003_0    10/04 20:14:54  10/04 20:18:05 (3mins, 10sec)   /default-rack/master

2012-04-10 20:18:04,470 INFO org.apache.hadoop.util.NativeCodeLoader: Loaded the native-hadoop library<br>2012-04-10 20:18:04,646 INFO org.apache.hadoop.metrics.jvm.JvmMetrics: Initializing JVM Metrics with processName=MAP, sessionId=<br>
2012-04-10 20:18:04,647 WARN org.apache.hadoop.conf.Configuration: user.name is deprecated. Instead, use mapreduce.job.user.name<br>
2012-04-10 20:18:04,751 INFO org.apache.hadoop.mapreduce.util.ProcessTree: setsid exited with exit code 0<br>
2012-04-10 20:18:04,754 INFO org.apache.hadoop.mapred.Task:  Using ResourceCalculatorPlugin : org.apache.hadoop.mapreduce.util.LinuxResourceCalculatorPlugin@79ee2c2c<br>
2012-04-10 20:18:04,912 INFO org.apache.hadoop.mapred.MapTask: (EQUATOR) 0 kvi 26214396(104857584)<br>
2012-04-10 20:18:04,912 INFO org.apache.hadoop.mapred.MapTask: mapreduce.task.io.sort.mb: 100<br>
2012-04-10 20:18:04,912 INFO org.apache.hadoop.mapred.MapTask: soft limit at 83886080<br>
2012-04-10 20:18:04,912 INFO org.apache.hadoop.mapred.MapTask: bufstart = 0; bufvoid = 104857600<br>
2012-04-10 20:18<br>:04,912 INFO org.apache.hadoop.mapred.MapTask: kvstart = 26214396; length = 6553600
2012-04-10 20:18:04,939 INFO org.apache.hadoop.mapred.MapTask: Starting flush of map output<br>
2012-04-10 20:18:04,940 INFO org.apache.hadoop.mapred.MapTask: Spilling map output<br>
2012-04-10 20:18:04,940 INFO org.apache.hadoop.mapred.MapTask: bufstart = 0; bufend = 18; bufvoid = 104857600<br>
2012-04-10 20:18:04,940 INFO org.apache.hadoop.mapred.MapTask: kvstart = 26214396(104857584); kvend = 26214392(104857568); length = 5/6553600<br>
2012-04-10 20:18:04,972 INFO org.apache.hadoop.mapred.MapTask: Finished spill 0<br>
2012-04-10 20:18:04,975 INFO org.apache.hadoop.mapred.Task: Task:attempt_201204101957_0006_m_000003_0 is done. And is in the process of commiting<br>
2012-04-10 20:18:05,058 INFO org.apache.hadoop.mapred.Task: Task 'attempt_201204101957_0006_m_000003_0' done.<br>

タスク トラッカー ログは、より多くのことを示しています。

2012-04-10 **20:14:54,615** INFO org.apache.hadoop.mapred.TaskTracker: In TaskLauncher, current free slots : 1 and trying to launch attempt_201204101957_0006_m_000003_0 which needs 1 slots<br>
2012-04-10 20:14:54,685 INFO org.apache.hadoop.mapred.JvmManager: JVM Runner jvm_201204101957_0006_m_377512887 spawned.<br>
2012-04-10 20:16:34,041 INFO org.apache.hadoop.mapred.TaskTracker: addFreeSlot : current free slots : 1<br>
2012-04-10 **20:18:04,433** INFO org.apache.hadoop.mapred.TaskTracker: JVM with ID: jvm_201204101957_0006_m_377512887 given task: attempt_201204101957_0006_m_000003_0<br>
2012-04-10 20:18:04,938 INFO org.apache.hadoop.mapred.TaskTracker: attempt_201204101957_0006_m_000003_0 0.0% <br>
2012-04-10 20:18:05,056 INFO org.apache.hadoop.mapred.TaskTracker: attempt_201204101957_0006_m_000003_0 0.667% Generated 1000 samples. <br>

sort
2012-04-10 20:18:05,058 INFO org.apache.hadoop.mapred.TaskTracker: タスク試行_201204101957_0006_m_000003_0 が完了しました。
2012-04-10 20:18:05,058 INFO org.apache.hadoop.mapred.TaskTracker: Attempt_201204101957_0006_m_000003_0 の報告された出力サイズは 28
2012-04-10 20:18:05,058 INFO org.apache.hadoop.mapred.TaskTracker: : 現在の空きスロット: 2
2012-04-10 20:18:05,213 INFO org.apache.hadoop.mapreduce.util.ProcessTree: プロセス グループのすべてのメンバーにシグナルを送信しています -23030: SIGTERM。終了コード 1
2012-04-10 20:18:08,478 INFO org.apache.hadoop.mapred.TaskTracker: マップから 0 を減らすために 28 バイトを送信しました:
2012-04-10 20:18:08,478 INFO org.apache.hadoop.mapred.TaskTracker: シャッフルされた 1 マップ (mapIds=attempt_201204101957_0006_m_000003_0) を 29 秒で 0 に減らす
2012-04-10 20:18:08,478 INFOaphadoop.org. mapred.TaskTracker.clienttrace: src: 147.102.7.173:50060、dest: 147.102.7.175:57289、maps: 1、op: MAPRED_SHUFFLE、reduceID: 0、duration: 29
2012-04-10 20:18:10,217 INFO org. apache.hadoop.mapred.JvmManager: JVM: jvm_201204101957_0006_m_377512887 が終了コード 0 で終了しました。実行したタスクの数: 1

ここでネットワークの問題が疑われますが、ping と ssh は問題なく実行できます。

4

0 に答える 0