sql - 本番環境でのPostgreSQLクエリが遅い-この説明の分析出力を理解するのに役立ちます

Question

GCC gcc（GCC）4.1.2 20080704（Red Hat 4.1.2-46）、64ビットでコンパイルされたx86_64-unknown-linux-gnu上のPostgreSQL9.0.0で実行するのに9分かかるクエリがあります

このクエリは、アプリケーションのhibernateによって自動的に生成されます。学校のすべての「教師メンバー」を見つけようとしています。メンバーシップは、グループ内の役割を持つユーザーです。グループにはいくつかの種類がありますが、ここで重要なのは学校とサービスです。誰かが奉仕の教師会員であり、この学校（15499）の会員である場合、彼らは私たちが探しているものです。

このクエリは、以前は本番環境で正常に実行されていましたが、開発でも正常に実行されますが、本番環境では実行に数分かかります。理由を理解するのを手伝ってもらえますか？

クエリは次のとおりです。

select distinct user1_.ID as ID14_, user1_.FIRST_NAME as FIRST2_14_, user1_.LAST_NAME as LAST3_14_, user1_.STREET_1 as STREET4_14_, user1_.STREET_2 as STREET5_14_, user1_.CITY as CITY14_, user1_.us_state_id as us7_14_, user1_.REGION as REGION14_, user1_.country_id as country9_14_, user1_.postal_code as postal10_14_, user1_.USER_NAME as USER11_14_, user1_.PASSWORD as PASSWORD14_, user1_.PROFESSION as PROFESSION14_, user1_.PHONE as PHONE14_, user1_.URL as URL14_, user1_.bio as bio14_, user1_.LAST_LOGIN as LAST17_14_, user1_.STATUS as STATUS14_, user1_.birthdate as birthdate14_, user1_.ageInYears as ageInYears14_, user1_.deleted as deleted14_, user1_.CREATEDATE as CREATEDATE14_, user1_.audit as audit14_, user1_.migrated2008 as migrated24_14_, user1_.creator as creator14_ 
from DIR_MEMBERSHIPS membership0_ 
inner join DIR_USERS user1_ on membership0_.USER_ID=user1_.ID, DIR_ROLES role2_, DIR_GROUPS group4_ 
where membership0_.role=role2_.ID 
and membership0_.GROUP_ID=group4_.id 
and membership0_.GROUP_ID=15499 
and case when membership0_.expires is null 
    then 1 
    else case when (membership0_.expires > CURRENT_TIMESTAMP and (membership0_.startDate is null or membership0_.startDate < CURRENT_TIMESTAMP)) 
        then 1 
        else 0 end 
    end =1 
and membership0_.deleted=false 
and role2_.deleted=false 
and role2_.NAME='ROLE_MEMBER' 
and group4_.deleted=false 
and user1_.STATUS='active' 
and user1_.deleted=false 
and (membership0_.USER_ID in (
    select membership7_.USER_ID 
    from DIR_MEMBERSHIPS membership7_, DIR_USERS user8_, DIR_ROLES role9_ 
    where membership7_.USER_ID=user8_.ID 
    and membership7_.role=role9_.ID 
    and case when membership7_.expires is null 
        then 1 
        else case when (membership7_.expires > CURRENT_TIMESTAMP 
                        and (membership7_.startDate is null or membership7_.startDate < CURRENT_TIMESTAMP)) 
            then 1 
            else 0 end 
        end =1 
    and membership7_.deleted=false 
    and role9_.NAME='ROLE_TEACHER_MEMBER'));

分析出力の説明：

 HashAggregate  (cost=61755.63..61755.64 rows=1 width=3334) (actual time=652504.302..652504.307 rows=4 loops=1)
   ->  Nested Loop  (cost=4355.35..61755.56 rows=1 width=3334) (actual time=304.450..652504.217 rows=6 loops=1)
     ->  Nested Loop  (cost=4355.35..61747.28 rows=1 width=3342) (actual time=304.419..652504.060 rows=6 loops=1)
           ->  Nested Loop Semi Join  (cost=4355.35..61738.97 rows=1 width=32) (actual time=304.385..652503.961 rows=6 loops=1)
                 Join Filter: (user_id = user_id)
                 ->  Nested Loop  (cost=0.00..32.75 rows=1 width=16) (actual time=0.190..26.703 rows=758 loops=1)
                       ->  Seq Scan on dir_roles role2_  (cost=0.00..1.25 rows=1 width=8) (actual time=0.032..0.038 rows=1 loops=1)
                             Filter: ((NOT deleted) AND ((name)::text = 'ROLE_MEMBER'::text))
                       ->  Index Scan using dir_memberships_role_group_id_index on dir_memberships membership0_  (cost=0.00..31.49 rows=1 width=24) (actual time=0.151..25.626 rows=758 loops=1)
                             Index Cond: ((role = role2_.id) AND (group_id = 15499))
                             Filter: ((NOT deleted) AND (CASE WHEN (expires IS NULL) THEN 1 ELSE CASE WHEN ((expires > now()) AND ((startdate IS NULL) OR (startdate < now()))) THEN 1 ELSE 0 END END = 1))
                 ->  Nested Loop  (cost=4355.35..61692.86 rows=1069 width=16) (actual time=91.088..843.967 rows=79986 loops=758)
                       ->  Nested Loop  (cost=4355.35..54185.33 rows=1069 width=8) (actual time=91.065..555.830 rows=79986 loops=758)
                             ->  Seq Scan on dir_roles role9_  (cost=0.00..1.25 rows=1 width=8) (actual time=0.006..0.013 rows=1 loops=758)
                                   Filter: ((name)::text = 'ROLE_TEACHER_MEMBER'::text)
                             ->  Bitmap Heap Scan on dir_memberships membership7_  (cost=4355.35..53983.63 rows=16036 width=16) (actual time=91.047..534.236 rows=79986 loops=758)
                                   Recheck Cond: (role = role9_.id)
                                   Filter: ((NOT deleted) AND (CASE WHEN (expires IS NULL) THEN 1 ELSE CASE WHEN ((expires > now()) AND ((startdate IS NULL) OR (startdate < now()))) THEN 1 ELSE 0 END END = 1))
                                   ->  Bitmap Index Scan on dir_memberships_role_index  (cost=0.00..4355.09 rows=214190 width=0) (actual time=87.050..87.050 rows=375858 loops=758)
                                         Index Cond: (role = role9_.id)
                       ->  Index Scan using dir_users_pkey on dir_users user8_  (cost=0.00..7.01 rows=1 width=8) (actual time=0.003..0.003 rows=1 loops=60629638)
                             Index Cond: (id = user_id)
           ->  Index Scan using dir_users_pkey on dir_users user1_  (cost=0.00..8.29 rows=1 width=3334) (actual time=0.011..0.011 rows=1 loops=6)
                 Index Cond: (id = user_id)
                 Filter: ((NOT deleted) AND ((status)::text = 'active'::text))
     ->  Index Scan using dir_groups_pkey on dir_groups group4_  (cost=0.00..8.28 rows=1 width=8) (actual time=0.023..0.023 rows=1 loops=6)
           Index Cond: (group4_.id = 15499)
           Filter: (NOT group4_.deleted)
Total runtime: 652504.827 ms
(29 rows)

フォーラムの投稿とユーザーマニュアルを読んで読んでいますが、関数を使用するselectのインデックスを作成できる場合を除いて、これを高速化する方法がわかりませんnow()。

score 14 · Accepted Answer

私はあなたのクエリを書き直し、これがより速くなると思います：

SELECT u.id AS id14_, u.first_name AS first2_14_, u.last_name AS last3_14_, u.street_1 AS street4_14_, u.street_2 AS street5_14_, u.city AS city14_, u.us_state_id AS us7_14_, u.region AS region14_, u.country_id AS country9_14_, u.postal_code AS postal10_14_, u.user_name AS user11_14_, u.password AS password14_, u.profession AS profession14_, u.phone AS phone14_, u.url AS url14_, u.bio AS bio14_, u.last_login AS last17_14_, u.status AS status14_, u.birthdate AS birthdate14_, u.ageinyears AS ageinyears14_, u.deleted AS deleted14_, u.createdate AS createdate14_, u.audit AS audit14_, u.migrated2008 AS migrated24_14_, u.creator AS creator14_
FROM   dir_users u 
WHERE  u.status = 'active'
AND    u.deleted = FALSE
AND    EXISTS (
   SELECT 1
   FROM   dir_memberships m
   JOIN   dir_roles       r ON r.id = m.role
   JOIN   dir_groups      g ON g.id = m.group_id
   WHERE  m.group_id = 15499
   AND    m.user_id = u.id
   AND   (m.expires IS NULL
       OR m.expires > now() AND (m.startdate IS NULL OR m.startdate < now()))
   AND    m.deleted = FALSE
   AND    r.deleted = FALSE
   AND    r.name = 'ROLE_MEMBER'
   AND    g.deleted = FALSE
   )
AND    EXISTS (
    SELECT 1
    FROM   dir_memberships m
    JOIN   dir_roles       r ON r.id = m.role
    WHERE (m.expires IS NULL
        OR m.expires > now() AND (m.startDate IS NULL OR m.startDate < now()))
    AND    m.deleted = FALSE
    AND    m.user_id = u.id
    AND    r.name = 'ROLE_TEACHER_MEMBER'
    )

で書き直し`EXISTS`

奇妙なcase ... end = 1表現を単純な表現に置き換えました
読みやすくするために、明示的な結合構文を使用してすべてのJOINを書き直しました。
大きなJOIN構成とIN式を2つのEXISTS半結合に変換しました。これにより、の必要性がなくなりDISTINCTます。これはかなり速いはずです。
クエリを簡単にするためのマイナーな編集がたくさんありますが、内容は変わりません。
特にシンパーエイリアスを使用してください-あなたが持っていたものは騒々しくて混乱していました。

インデックス

これがまだ十分に速くなく、書き込みパフォーマンスがより多くのインデックスを処理できる場合は、この部分的な複数列のインデックスを追加します。

CREATE INDEX dir_memberships_g_id_u_id_idx ON dir_memberships (group_id, user_id)
WHERE  deleted = FALSE;

インデックスを使用するには、WHERE条件がクエリと一致している必要があります。

関連する外部キーの主キーとインデックスがすでにあると思います。

さらに遠く：

CREATE INDEX dir_memberships_u_id_role_idx ON dir_memberships (user_id, role)
WHERE  deleted = FALSE;

なぜuser_id二度目？見る：

また、すでに別のインデックスで使用されているため、 HOT更新user_idをブロックしていません（これは、どのインデックスにも含まれていない列でのみ使用できます。

なぜroleですか？両方の列がタイプ（4バイト）
であると想定しています。integer詳細な質問で、8バイトの64ビットOSを実行しているMAXALIGNので、別の整数ではインデックスがまったく大きくならないことがわかりました。role2回目のセミジョインに役立つかもしれないものを投入しましたEXISTS。

多くの「死んだ」ユーザーがいる場合、これも役立つ可能性があります。

CREATE INDEX dir_users_id_idx ON dir_users (id)
WHERE status = 'active' AND deleted = FALSE;

いつものようにEXPLAIN、インデックスが実際に使用されているかどうかを確認してください。無駄なインデックスがリソースを消費することは望ましくありません。

もう速いですか？

もちろん、パフォーマンスの最適化に関する通常のアドバイスもすべて当てはまります。

score 4 · Accepted Answer

クエリから最後の4つの条件を差し引いたもの、つまり

and group4_.deleted=false 
and user1_.STATUS='active' 
and user1_.deleted=false 
and (membership0_.USER_ID in (...))

758行を返します。次に、これらの758行のそれぞれselect membership7_.USER_ID ...がサブクエリを通過し、実行に843.967ミリ秒かかります。

843.967 * 758 = 639726.986、10分かかります。

DIR_USERS user8_クエリの調整に関しては、サブクエリでは必要ないと思います。EXISTSそれを削除し、の代わりに使用するようにサブクエリを変更することから始めることができますIN。

ちなみに、データベースはバキュームされていますか？調整を行わなくても、10分かかるほど複雑なクエリや大量のデータは表示されません。

sql - 本番環境でのPostgreSQLクエリが遅い-この説明の分析出力を理解するのに役立ちます

2 に答える 2

で書き直しEXISTS

インデックス

Related

Reference

で書き直し`EXISTS`