0

Apache Pig でデータを特定の形式に変換して、その上でレポート ツールを使用できるようにしたいと考えています。

例えば:

10:00,abc
10:00,cde
10:01,abc
10:01,abc
10:02,def
10:03,efg

出力は次の形式である必要があります。

        abc   cde  def  efg 
10:00   1      1    0    0
10:01   2      0    0    0
10:02   0      0    1    0

ここでの主な問題は、サンプルの csv ファイルで使用可能なさまざまな値に応じて、合計で最大 120 まで、値が連続して複数回発生する可能性があることです。

これに取り組むための提案は大歓迎です。

ありがとうガガン

4

1 に答える 1