0

データ フローでは、Web サービスにクエリを実行するスクリプト コンポーネントを使用してデータを取得します。出力は、顧客からの支払いを含むテーブルです。

| PaymentId | CustomerId | Amount | PaymentDate |
| 2         | 1          | 10     | 01/01/2009  |
| 5         | 1          | 15     | 08/07/2013  |
| 1         | 2          | 20     | 05/08/2007  |
| 3         | 2          | 18     | 07/03/2011  |
| 6         | 2          | 32     | 02/09/2013  |
| 4         | 3          | 70     | 04/06/2012  |
| 7         | 3          | 61     | 02/03/2013  |

とりわけ、顧客ごとに次の行を除外する必要があります。

  • 最大額の支払い
  • 最小額での支払い
  • 最初の支払い
  • 直近の支払い

それぞれについて、後の処理のために PaymentId、CustomerId、Amount、および PaymentDate が必要です。

Aggregate Transformation を使用し、CustomerId でグループ化し、適切な Min/Max 関数を使用して要求された値を取得する方法を知っています。

しかし、完全なROWSを取得するための最良のアプローチは何ですか?

前もって感謝します!

4

1 に答える 1

1

データ ソースが SQL データベースの場合は、SSIS に到達する前に、SQL でできることを行ってください。これにより、一般的に最高のパフォーマンスが得られます。

それ以外の場合は、Web サービスからRAWファイルにデータをダンプすることをお勧めします。生ファイルは、さまざまな変換を行うためにデータをステージングするのに非常に役立ちます。RAW ファイルの詳細

于 2013-07-15T02:11:44.780 に答える