マップリデュースデザインはまったく新しいです。私はバックエンドとマップリデュースエンジンとしてmongodbを使用しています。
次のような単純なデータセットの場合:
day, value
ここで、値は-1、0、または1です。各行に期間を追加します。ここで、durationは、値が1または-1に等しい連続日数です。
例の入力データセット:
day| value
2012-01-01| 1
2012-01-02| 1
2012-01-03| 1
2012-01-04| -1
2012-01-05| -1
2012-01-06| 0
2012-01-07| 1
2012-01-08| 1
出力は次のようになります:
day| value | Duration
2012-01-01| 1 | 0
2012-01-02| 1 | 1
2012-01-03| 1 | 2
2012-01-04| -1 | 0
2012-01-05| -1 |-1
2012-01-06| 0 | 0
2012-01-07| 1 | 0
2012-01-08| 1 | 1
これはマップリデュースジョブで実行可能ですか?