3

Awsラムダ関数+ファイアホースでDynamoDBストリームを使用して、データをredshiftと同期しています。すべての DynamoDB レコードをストリームに追加して再処理することが可能かどうかを知りたいです。そうでない場合、正しいアプローチは何ですか?

4

2 に答える 2

1

古いデータを再処理するには、並列化された全テーブル スキャンが最適です。「古いデータ」から「新しいデータ」への移行を処理する方法を決定する問題がありますが、タイムスタンプ属性が利用可能な場合はそれを使用するか、可能であればテーブルへの書き込みを停止することで達成できます。

于 2016-09-19T06:45:46.413 に答える
1

新しいデータの場合、これを行うことができます。履歴データの場合は、これを行わない方がよいでしょう。最初にテーブルをダンプしてからインポートできます。

于 2016-09-18T09:09:43.263 に答える