postgresql - Amazon Redshift s3 からコピーして job_id を設定する方法

Question

Amazon Redshift は、「コピー」コマンドを使用して s3 オブジェクトからテーブルデータをロードする機能を提供します。copyコマンドを使用する方法ですが、挿入された行ごとに追加の「col = CONSTANT」も設定します。

コピーされた各行に job_id (ソースデータにはありません) を設定したいのですが、「コピー」が取得されたときに各行にジョブ属性があるように、数百万回の挿入を実行する必要があるのは残念だと思います。はるかに優れたパフォーマンスで 99% 達成できました。

多分もっと賢い解決策がありますか？

score 0 · Accepted Answer

COPYコマンド自体で後/前処理を行うオプションはないようです。したがって、最善の選択肢は、Redshift に入れる予定のファイルを前処理しCOPY、ジョブ ID を追加してから Redshift にロードすることです。

2 に答える 2