0

以下のような入力ファイルがあり、複数の顧客レコードをそれぞれの四半期に変換し、顧客ごとに記録しようとしています。四半期 (2019 年第 2 四半期など) がデータから導出されると、最新のものは TimeFrame4 に移動し、古いものは 3,2,1 の順序になります。

これまでのところ、トランスフォーマーを使用して四半期を導き出すことができましたが、その後、それらを特定してそれぞれのバケット (TimeFrame1 TimeFrame2 TimeFrame3 TimeFrame4) に割り当てる方法に行き詰まりました。DataStage (11.3 並列ジョブ) でこれを効果的に実装する方法 (入力には 50M レコードがあります) に関するアイデア。

入力:

CustID  Contacted_Time
1       2018-12-25
1       2019-06-15
1       2019-01-03
2       2019-02-24
2       2019-03-05

以下のような出力が必要です。

CustID TimeFrame1   TimeFrame2  TimeFrame3  TimeFrame4
1       null        Q4 2018     Q1 2019     Q2 2019
2       null        null        null        Q1 2019
4

1 に答える 1