私はPigがまったく初めてです。iid フィールドを使用して 2 つのファイル A と B を結合したいのですが、A にない (B からの) iid を出力に含めたくありません。これは簡単に思えますが、正しく行う方法がわかりません。
ユニオンのみを持つサンプルコードは次のとおりです。
a = load '$input' as (iid:int, field:chararray, v1:chararray, v2:chararray, v3:chararray);
b = load '$data' as (iid:int, field:chararray, v1:chararray, v2:chararray, v3:chararray);
out = union onschema a,b;
singled = distinct out;
ordered = order singled by iid;
store ordered into '$output';
以下は、私が期待することを説明するための 3 列のみのサンプル データです。フィールドは実際にはタブで区切られていることに注意してください。
サンプルデータ A:
1 Name Tom Linkon
1 Title Professor
2 Name Whatever
2 Title Worker
サンプルデータ B:
1 City New York
2 City Columbus
3 City Fake fake
4 City Blah Bla
サンプル出力
1 Name Tom Linkon
1 Title Professor
1 City New York
2 Name Whatever
2 Title Worker
2 City Columbus
助けてくれてどうもありがとう!