0

ソースバケット S1 から AWS グルーを使用して作成されたテーブルの 1 つにデータをロードしようとしています。

( session_id, Date, type, action )以下の値を持つ 4 つの列を持つソース バケット。購入トランザクションは 1 分間続き、同じレコードが 2 つ取得されます。場合によっては、終了レコードを取得できません

session_id, Date, type, action
1, 01jan20 10:00, purchase, start
1, 01jan20 10:01, Purchase, End
1, 02jan20 11:01, bal, start 
1, 02jan20 11:05, bal, end 
2, 02jan20 11:10, bal, start 

これらのレコードを挿入したいターゲットテーブルがあります。以下の構造になっています。

id, startdt, enddt, duration_spent_seconds, action
1 01jan20 10:00, 01jan20 10:01, 60, Purchase
1 01jan20 11:01, 01jan20 11:05, 240, bal
2 01jan20 11:10, , , Bal

私は AWS を初めて使用します。AWS グルーを試していますが、ターゲット テーブル/結果を S3 に保存したいと考えています。

誰かがこれを達成する方法について詳しく教えてください。

始められて本当に良かったです

4

1 に答える 1