デフォルトでは、hadoop マップ タスクは、処理されたレコードを一時ディレクトリのファイルに書き込みます${mapred.output.dir}/_temporary/_${taskid}
。これらのファイルは、FileCommiter が移動するまで${mapred.output.dir}
(タスクが正常に終了した後)、ここに置かれます。マップ タスクで、上記の一時ディレクトリの下にファイルを作成する必要がある場合があります。そこでsetup()
は、後で別の場所で使用されるプロセス関連のデータを書き込みます。ただし、hadoop タスクが強制終了されると、一時ディレクトリが HDFS から削除されます。
タスクが強制終了された後にこのディレクトリを削除しないように Hadoop に指示できるかどうか、またそれを達成する方法を知っている人はいますか? 構成できるプロパティを提供する必要があると思います。
よろしく