Apache Pig でデータを特定の形式に変換して、その上でレポート ツールを使用できるようにしたいと考えています。
例えば:
10:00,abc
10:00,cde
10:01,abc
10:01,abc
10:02,def
10:03,efg
出力は次の形式である必要があります。
abc cde def efg
10:00 1 1 0 0
10:01 2 0 0 0
10:02 0 0 1 0
ここでの主な問題は、サンプルの csv ファイルで使用可能なさまざまな値に応じて、合計で最大 120 まで、値が連続して複数回発生する可能性があることです。
これに取り組むための提案は大歓迎です。
ありがとうガガン