以下のような入力ファイルがあり、複数の顧客レコードをそれぞれの四半期に変換し、顧客ごとに記録しようとしています。四半期 (2019 年第 2 四半期など) がデータから導出されると、最新のものは TimeFrame4 に移動し、古いものは 3,2,1 の順序になります。
これまでのところ、トランスフォーマーを使用して四半期を導き出すことができましたが、その後、それらを特定してそれぞれのバケット (TimeFrame1 TimeFrame2 TimeFrame3 TimeFrame4) に割り当てる方法に行き詰まりました。DataStage (11.3 並列ジョブ) でこれを効果的に実装する方法 (入力には 50M レコードがあります) に関するアイデア。
入力:
CustID Contacted_Time
1 2018-12-25
1 2019-06-15
1 2019-01-03
2 2019-02-24
2 2019-03-05
以下のような出力が必要です。
CustID TimeFrame1 TimeFrame2 TimeFrame3 TimeFrame4
1 null Q4 2018 Q1 2019 Q2 2019
2 null null null Q1 2019