0

Pig を使用して、次の形式の大きな txt ファイルを 1 つ取得しています。

コルA | B列 | C列 | D列 | E列 | 列 F | コルG

私の目標は、この入力を取得し、列のさまざまな組み合わせでグループ化して、このようなものを取得することです

(列 A/列 B) | カウント(Col F) | Sum(Col G)

(列 A / 列 C) | カウント(Col F) | Sum(Col G)

(Col A / Col D) | カウント(Col F) | Sum(Col G)

(Col B / Col C) | カウント(Col F) | Sum(Col G)

入力が同じままでグループ化だけが変更されるため、可能な限り最小限の回数だけデータを処理する必要があるように、豚のコードを構造化する方法があるかどうか疑問に思っています。

ありがとうございます。

4

1 に答える 1