1) ATG_Data (データ ソース 1) と 2) テキスト レコードの 2 つのデータ ソースがあります。両方のソースを結合した後、出力が期待どおりになりません。
例えば、
2 つのレコードがあります (両方のソースに存在します)。両方のレコードにこれら 3 つのプロパティがありますが、最終的には他のプロパティも持っています。
Item Id Vendor Id Ranking(P_CommPtp)
レコード 1 703595 2560 10 レコード 2 703595 5638 11
しかし、参加(左参加)後の最終記録は
Item Id Vendor Id Ranking(P_CommPtp)
レコード 1 703595 2560 10
レコード 2 703595 5638 11
レコード 3 703595 2560 10 11 レコード 4 703595 5638 10 11
ランキングがマージされて、さらに 2 つのレコードが作成されます。
パイプラインでは、次のインデックスに基づいてデータをキャッシュしています。
ATG データ - 1) アイテム番号
2) Vendor Id
テキストファイル - 1) アイテム番号
左結合を使用しています。
さらに 2 つのレコードが作成される理由がわかりません。SKU レベルでインデックス作成を行っています。これら 3 つのプロパティは、レコードの一意性を意味しません。これで私を助けてもらえますか?