sql - Web アプリで高速な「select count(*)」機能を提供する

Question

全国的なエンジニアリングコンテストをサポートするアプリを再実装し、ローカルサーバーからクラウドに移行しています。

チームが現在どこに立っているかをチームに伝えるために、クエリの形式は次のとおりです。

select 1 + count(*) from team where where score < ?

チームのスコアは非常に動的に変化します。最大 200 万のチームが存在する可能性があり、これらのクエリを 1 秒あたり少なくとも 10 件処理する必要があります。

オリジナルは、チーム/スコアレコードの別のバークレー DB を使用することにより、必要なパフォーマンスを取得します (実際には 1999 のハードウェアで既に行われています)。Berkeley DB には、まさに適切な機能を提供する「レコード番号」機能があり、非常に高速です。

Heroku は明らかに Berkeley DB をサポートする方法がありません。彼らの標準 DB である PostgreSQL はselect count(*)、完全なテーブルまたはインデックススキャンを実行しますが、これは遅すぎます。

続行する方法についてのアイデアはありますか？私は Heroku に慣れていませんが、何らかのクラウドソリューションに移行する必要があります。

score 2 · Accepted Answer

ランクテーブルを作成し、適切な頻度で更新します。カテゴリ (オープンまたは公式) とスコアを含めて、クエリ時にチームテーブルに結合する必要がないようにします。

create table "rank" (
    team integer primary key, 
    category integer,
    score integer,
    rank_consolidated integer,
    rank_category integer
);

begin;
truncate table "rank"
;
insert into "rank" (team, category, score, rank_consolidated, rank_category)
select 
    team, category, score,
    rank() over(order by score desc) rank_consolidated,
    rank() over(partition by category order by score desc) rank_category
from team
;
commit
;
select * from "rank" where team = 11;

正確なランキング動作については、ウィンドウ関数を調べてください

score 2 · Accepted Answer

redisを使用して、チームデータをsorted set. 次に、ZRANK関数は必要な数を返します。Redis は一般的に非常に高速であり、ZRANK関数は O(log N) 期待されます。スキップリストで実装されています。

score 0 · Accepted Answer

スコアにインデックスを配置すると、テーブル全体のスキャンを回避できます。

sql - Web アプリで高速な「select count(*)」機能を提供する

4 に答える 4

Related

Reference