2

私の現在のプロジェクトでは、関連するデータが変更された時点で計算される可能性のあるいくつかのマップ削減ジョブを作成しました。

集計計算を実行する最も安価な時間に関して、広く受け入れられている経験則があるかどうかに興味があります。

私は次のように始めるかもしれません:

  1. すべてのレコードを渡す以外に選択肢がなく、データが頻繁に変更される場合は、これをバッチ プロセスに延期します。
  2. 全体を計算するのはコストがかかるがインクリメントは簡単な場合は、書き込み時にインクリメントする必要があります。
4

0 に答える 0