11

Firehose->S3 は、S3 でキーを作成するためのプレフィックスとして現在の日付を使用します。したがって、これにより、レコードが書き込まれるまでにデータが分割されます。Firehose ストリームには、特定のイベント時間を持つイベントが含まれています。

代わりに、このイベント時間を含む S3 キーを作成する方法はありますか? 下流の処理ツールは、実際に発生した時間に関連する「時間フォルダー」にある各イベントに依存します。それとも、Firehose が完了した後に追加の処理ステップを行う必要がありますか?

イベント時間はパーティション キーに含まれている可能性があります。または、Lambda 関数を使用してレコードから解析することもできます。

4

5 に答える 5