Amazon EMR でジョブを実行すると、S3 で出力が得られません。
引数を指定しました:
-inputfile s3n://exdsyslab/data/file.txt -outputdir s3n://exdsyslab/output
ジョブログを確認すると、ジョブが正常に完了したことがわかります。しかし、私のバケット exdsyslab の出力フォルダーには出力がありません。
また、もう1つ試してみました。
2 つのジョブをチェーンしました: ジョブ フローの作成中に引数を指定しました:
-inputfile s3n://exdsyslab/data/file.txt -outputdir s3n://exdsyslab/result -outputdir1 s3n://exdsyslab/result1
2 番目のジョブの入力は、最初のジョブの出力です。
プログラムの実行中に、2 番目のジョブで次の例外に直面しました。
The output folder, "result", already exists.
これは、ディレクトリがチェーン内の最初のジョブによって作成されたために発生しました。mapreduce チェーンの 2 番目のジョブの入力と出力を指定するにはどうすればよいですか?
引数で指定された s3 バケットに出力があるのはなぜですか?