ファイルを S3 にアップロードするプロセスがあります。実際、それは間接的です。Amazon Elastic MapReduce (EMR) を使用し、Hadoop は多くの異なるタスクノードから S3 にファイルをコミットします。次に、その Hadoop ジョブが正常に完了した後、プロセスの別の部分で Hadoop の FileSystem.createNewFile() を使用して、マスター ノードからいくつかのファイルを作成します。
これらのさまざまなマシンから作成されたファイルには、S3 にタイムスタンプがあります。タスク ノードからコミットされたファイルのタイムスタンプは、マスター ノードから作成されたファイルより前であると想定しています。
それは時々真実ではないと思いますが、なぜですか?
タイムスタンプを S3 ファイルに割り当てるのは何ですか? Amazon EMR Hadoop クライアントですか、それとも S3 マシンですか?
S3 にアップロードする 2 台のマシンのローカル クロックが 30 分異なる場合、タイムスタンプは 30 分ずれますか?