2

Informatica を使用して 2 つのフラット ファイルで一致する行を除外するにはどうすればよいですか?

次のようなデータを含むフラット ファイル (ソース) があります (通常はさらに多くのデータ)。

1,2,3
4,5,6

2 番目のフラット ファイル (ソース) は次のようになります。

1,2,3

結果 (ターゲット) を次のようなフラット ファイルにしたい:

4,5,6

SQLには、仕事をするEXCLUDE(INTERSECTの反対)があることを知っています。しかし、私はこれをすべてフラットファイルと Informatica で行っています。

私はインフォマティカにかなり慣れていません。私はそれを約1か月しかやっていません。だから、それはかなり明白かもしれません。どの変換を使用するか教えていただければ、それは素晴らしいことです。

4

2 に答える 2

2

ユニオン変換を使用して、両方のファイルからの結果セットをユニオンできます。これにより、次の結果セットが得られます。

col1, col2, col3
-----------------
1,2,3
4,5,6
1,2,3

この後、アグリゲーター変換を使用して、これらのポート (およびそれらを重複と見なすためにグループ化するポート) を選択し、アグリゲーター変換でカウントを取得します。

After Aggregator (new column count => total_count)
----------------------------------------------------
col1, col2, col3,total_count
-----------------------------
1,2,3,2
4,5,6,1

次のステップは簡単です。フィルター変換を介してそれらを渡し、次のフィルター条件を使用して重複のある行を無視します。

合計数 = 1

于 2011-03-08T21:53:36.077 に答える
1

最初のファイルをソースとしてインクルードし、一致する可能性のあるポートに基づいてルックアップトランスフォーメーションを使用して2番目のファイルをルックアップします。次に、フィルターを使用して、ルックアップキャッシュからヒットバックしたレコードを削除できます。

この方法は集計を必要としないため、パフォーマンスが向上する可能性があります。

于 2011-04-04T10:56:40.780 に答える