java - Amazon EMR: java.io.IOException: ファイルは既に存在します: s3n:///output/part-r-00002

Question

MapReduce ジョブを実行しています。私のコードは、単純な計算を行う 1 つのクラスだけで構成されています。hadoop1.0.3 の単一ノード設定で正常に実行されます EMR で実行すると、次のエラーが表示されます

java.io.IOException: File already exists: s3n://<bucketname>/output/part-r-00002
at org.apache.hadoop.fs.s3native.NativeS3FileSystem.create(NativeS3FileSystem.java:647)
at org.apache.hadoop.fs.FileSystem.create(FileSystem.java:557)
at org.apache.hadoop.fs.FileSystem.create(FileSystem.java:538)
at org.apache.hadoop.fs.FileSystem.create(FileSystem.java:445)
at org.apache.hadoop.mapreduce.lib.output.TextOutputFormat.getRecordWriter(TextOutputFormat.java:128)
at org.apache.hadoop.mapred.ReduceTask$NewTrackingRecordWriter.<init>(ReduceTask.java:583)
at org.apache.hadoop.mapred.ReduceTask.runNewReducer(ReduceTask.java:652)
at org.apache.hadoop.mapred.ReduceTask.run(ReduceTask.java:426)
at org.apache.hadoop.mapred.Child$4.run(Child.java:255)
at java.security.AccessController.doPrivileged(Native Method)
at javax.security.auth.Subject.doAs(Subject.java:396)
at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1132)
at org.apache.hadoop.mapred.Child.main(Child.java:249)

score 2 · Accepted Answer

実行するたびに異なる出力ディレクトリに結果を書き込むようにジョブを構成する必要があります。

おそらくこのジョブを複数回実行したことが原因で、この場所にファイルが既に存在するため、現在問題が発生しています。

java - Amazon EMR: java.io.IOException: ファイルは既に存在します: s3n:///output/part-r-00002

1 に答える 1

Related

Reference