Hadoopでこのようなことに苦労しています
マッパーの結果として次のようになります
KeyValue1, 2014-02-01 20:42:00
KeyValue1, 2014-02-01 20:45:12
KeyValue1, 2014-05-01 10:35:02
KeyValue2, 2014-03-01 01:45:12
KeyValue2, 2014-03-01 02:08:18
KeyValue3, 2014-02-01 20:45:12
KeyValue4, 2015-02-01 05:45:12
KeyValue4, 2013-02-01 10:45:12
そして続く..
結局のところ、私はこれが欲しいです。
KeyValue1, TimeDifference(first occurrence - last occurrence)
KeyValue2, TimeDifference(first occurrence - last occurrence)
KeyValue3, -occured once-
KeyValue4, TimeDifference(first occurrence - last occurrence)
どんな入力でも大歓迎です。乾杯