2

データベースに 20,000 個のデータ ポイントがあり、Google の注釈付きグラフに表示したいと考えています。実際にグラフを使用するには約 2000 ポイントが適切な数になると思うので、私が持っているデータ ポイントの実際の量ではなく平均を使用したいと考えています。

このデータは、ある時間における何かの頻度をカウントします。Table(frequency, datetime) のようになります

したがって、最初の 1 週間は、datetime に 10 分ごとの間隔を持たせ、frequency はその時間間隔 (10 分) のすべての頻度の平均になります。同様に、その翌月には、日時間隔を 1 時間などにします。

これは、Google Finance でも見られるものだと思います。しばらくすると、ズームインしてもデータポイントの解像度が低下します。

では、これに適した設計は何でしょうか。このようなことを行うためのツールはすでに存在しますか? 20,000 ポイントすべての巨大なテーブルと、各時間間隔 (1 週間、1 か月など) を表すいくつかの小さなテーブルを既に考えていました (それは良くないかもしれません)。これらは、大きなテーブルへのクエリによって構築され、常に更新およびトリミングされます。新しい平均で。

4

1 に答える 1

1

1つのテーブルのデータベースに生データを保持します。スクリプトまたはクエリを使用して生のテーブルからデータを入力する2番目のreprtigテーブルを用意します。レポートテーブルに入力する変換では、バケットをグループ化して平均化できます。重要なことは、最初の挿入時にデータを変換しないことです。すべての生データを保持します。そうすれば、何かを台無しにした場合でも、いつでもロールバックまたは再構築できます。

ETL。勉強しなさい。大好きです。それを生きる。

于 2012-07-16T23:59:45.827 に答える