これは Google App Engine に適用できますが、必ずしも制約されるわけではありません。
Google App Engine では、データベースはリレーショナルではないため、集計関数 (合計、平均など) を実装できません。各行は互いに独立しています。合計と平均を計算するには、アプリは、データベースへの個々の新しい書き込みごとに再計算して計算を償却するだけで、常に最新の状態になります。
パーセンタイルと度数分布 (すなわち密度) を計算するにはどうすればよいでしょうか? 値のフィールドの密度のグラフを作成したいのですが、この値のセットはおそらく数百万のオーダーです。データセット全体をループして (各クエリの制限は返される 1000 行です)、それに基づいて計算することは可能かもしれませんが、私はむしろスマートなアプローチをしたいと思います。
一定期間にわたって計算できる密度/頻度/パーセンタイル分布を計算または概算するアルゴリズムはありますか?
ところで、データは不確定で、最大値と最小値があちこちにある可能性があります。したがって、分布はデータの約 95% を取り、それに基づいて密度のみを実行する必要があります。