複数の配信ストリームに対して 1 つの s3 バケットを設定することをお勧めしますか? (例: 異なるストリーミング スループット、s3 バッファー サイズ/バッファー間隔を持つ 2 つの配信ストリームを検討してください...)
2 つの配信ストリーム (S1、S2) がデータを redshift にルーティングしている場合。S1 はデータを T1 に配信し、S2 は T2 にデータを配信しています。T2 では、T1 に外部キー制約があります。S2 がデータ (D2) を T2 に配信するときに、D2 によって参照される T1 内のすべてのレコードが S1 によって既に配信されていることを保証できますか? (つまり、配信ストリームに依存関係があります)
ところで、私は firehose を使用して、分析のためにアプリケーション ログを redshift にプッシュしています。