6

Pentaho の新品 (そして初心者の SO ポスターなので、気をつけてください!)

Kettle/PDI を使用して、RDBMS からのデータを次のように変換したいと思います (たとえば)。

質問1 質問2 質問3 質問4
1/1/13 123.00 テスト 1 テスト 1.1
1/2/13 124.00 テスト 2 テスト 1.2
1/3/13 125.00 テスト 3 テスト 1.3
1/4/13 126.00 テスト 4 テスト 1.4
1/5/13 127.00 テスト 5 テスト 1.5

これに:

QuestionName AnswerDate AnswerNumber AnswerString
質問1 1/1/13     
質問1 1/2/13     
質問1 1/3/13     
質問1 1/4/13     
質問1 1/5/13     
質問2 123.00
質問2 124.00
質問2 125.00
質問2 126.00
質問2 127.00
Question3 テスト 1
Question3 テスト 2
質問3 テスト3
質問3 テスト4
Question3 テスト 5
Question4 テスト 1.1
Question4 テスト 1.2
Question4 テスト 1.3
Question4 テスト 1.4
Question4 テスト 1.5

上記のように、元のテーブルで使用可能なデータ型ごとに "Answer<FieldDataType>" 列が必要です。これはPDIで可能ですか?もしそうなら、誰かが私にいくつかの指針を提供できますか?行正規化ステップを使用してテーブルをピボットし、新しいフィールドを割り当てようとしましたが、おそらく正しく行われていません (またはバグ [PDI 4.4] があります)。

4

3 に答える 3

0

これは、入力行の列と各列の値を含む出力行を記述するスクリプト手順を使用して実現しました。そこから、正規表現の評価ステップに進み、複数のキャプチャ グループを使用して値の型をストリーム内の追加の列にマップしました。しばらくの間、Row Normalizer をいじりましたが、思いどおりに動作させることができませんでした。スクリプティング ステップを使用した場合のパフォーマンスの低下はごくわずかでした。

于 2013-08-27T19:54:59.287 に答える