8

Amazon Redshift は、「コピー」コマンドを使用して s3 オブジェクトからテーブル データをロードする機能を提供します。copyコマンドを使用する方法ですが、挿入された行ごとに追加の「col = CONSTANT」も設定します。

コピーされた各行に job_id (ソースデータにはありません) を設定したいのですが、「コピー」が取得されたときに各行にジョブ属性があるように、数百万回の挿入を実行する必要があるのは残念だと思います。はるかに優れたパフォーマンスで 99% 達成できました。

多分もっと賢い解決策がありますか?

4

2 に答える 2

0

COPYコマンド自体で後/前処理を行うオプションはないようです。したがって、最善の選択肢は、Redshift に入れる予定のファイルを前処理しCOPY、ジョブ ID を追加してから Redshift にロードすることです。

于 2013-07-07T06:51:39.080 に答える