4

API-Gateway > Kinesis Streams > Lambda > FireHose > Redshift Tables を介してすべての分析フィードを消費します。

AWS Lambda は当社の変換フットプリントであり、Kinesis ストリーム レコードを受け入れ、コンテキストに基づいて分析イベントを変更し、それを FireHouse にドロップして Redshift DB に保存します。

このジャーニーでは、特定の条件 (基本的に UPSERT ( Insert | Update ) ) で Redshift レコードを更新したいと考えました。redshift でレコードの重複を避けることができるものはありますか?

4

1 に答える 1

1

箱から出して、いいえ。

アップサート先のテーブルが T1 の場合、できることは次のとおりです。

  • Firehose がレコードを別のテーブル T2 にダンプするようにします。
  • cron などを使用して、T2 から T1 に定期的にアップサートするジョブを実行します。このクエリと Firehose から Redshift へのクエリの両方が実行されているときにデータが破損しないように、トランザクションを使用します。
于 2016-11-21T07:10:13.753 に答える