次のようなエネルギー消費のファクト テーブルがあります。
f_meter_data:
utc_calendar_id
local_calendar_id
meter_id
reading
timestamp
カレンダー テーブルは Kimball の推奨事項に従って構造化されており、ユーザーがローカル時間と UTC 時間でクエリできるように 2 つのカレンダー ID を用意している理由は、データ ウェアハウス ツールキットの推奨事項です。
これで問題はありませんが、夏時間が始まると問題が発生します。
粒度が 30 分単位であるため、時計が変わるとファクト レコードが重複します。
また、クロックが逆方向に変化すると、データにギャップが生じます。
どうすればこの状況に対処できますか?
重複した値を平均して代わりに保存する必要がありますか?
また、データにずれがある場合は、ずれの直前と直後の平均をとればいいのでしょうか?