フォームの入力レコードがあります
2013-07-09T19:17Z,f1,f2
2013-07-09T03:17Z,f1,f2
2013-07-09T21:17Z,f1,f2
2013-07-09T16:17Z,f1,f2
2013-07-09T16:14Z,f1,f2
2013-07-09T16:16Z,f1,f2
2013-07-09T01:17Z,f1,f2
2013-07-09T16:18Z,f1,f2
これらは、タイムスタンプとイベントを表します。これらは手書きで書いていますが、実際のデータは時間に基づいてソートする必要があります。
連続時系列を必要とするグラフ プロット関数に入力される一連のレコードを生成したいと思います。欠損値を埋めたいのですが、「2013-07-09T19:17Z」と「2013-07-09T19:19Z」のエントリがある場合、「2013-07-09T19:18Z」のエントリを生成したいと思います。 " 事前定義された値で。
これを行うことについての私の考え:
- MIN と MAX を使用して、シリーズの開始日と終了日を見つけます
- 最小値と最大値を取り、欠落しているタイムスタンプとの関係を返す UDF を記述します
- 上記の 2 つの関係を結合する
ただし、PIGでこれを実装する方法については頭に浮かびません。助けていただければ幸いです。
ありがとう!