入力場所が S3 のファイルである場合、EMR ジョブを呼び出してから実際にデータの mapreduce 処理を開始するまでに長い待ち時間があることに気付きました。私の質問は、EMR はネイティブ S3 ファイルシステムにあるデータで直接実行されますか、それともプロビジョニングされた EC2 マシンの HDFS クラスター (EMR クラスター内) にデータをコピーしますか?データのコピーにかかる時間は?
入力場所が S3 のファイルである場合、EMR ジョブを呼び出してから実際にデータの mapreduce 処理を開始するまでに長い待ち時間があることに気付きました。私の質問は、EMR はネイティブ S3 ファイルシステムにあるデータで直接実行されますか、それともプロビジョニングされた EC2 マシンの HDFS クラスター (EMR クラスター内) にデータをコピーしますか?データのコピーにかかる時間は?