0

私は一見非常に単純な問題を抱えていますが、それを理解できないようです。

次のようなデータがあります。

A (B, C, A)
B (X, Y, Z)
C (F, C, D)

Pig latin を使用して、最初の列のテキストが 2 列目に存在するかどうかを確認しています。

これは今のところ私のコードです:

Labels = LOAD 'example.txt' USING PigStorage('\t');

Projected = FOREACH Labels GENERATE $0 AS id, $1 AS group;

X = FILTER Projected BY (group matches '.*(chararray)id.*');

STORE X INTO '/test' USING PigStorage(',');

私が期待している出力は次のとおりです。

A (B, C, A)
C (F, C, D)

また、「.*」を id に連結しようとしましたが、役に立ちませんでした。

私はかなり長い間これに固執しており、どんな助けでも大歓迎です。ありがとう!

4

1 に答える 1