postgresql - Postgres がサブクエリをインライン化しないようにするにはどうすればよいですか?

Question

以下は、Postgres 9.1.6 での遅いクエリです。最大カウントは 2 ですが、両方の行が主キーによって既に識別されています: (4.5 秒)

EXPLAIN ANALYZE SELECT COUNT(*) FROM tbl WHERE id IN ('6d48fc431d21', 'd9e659e756ad') AND data ? 'building_floorspace' AND data ?| ARRAY['elec_mean_monthly_use', 'gas_mean_monthly_use'];
                                                                     QUERY PLAN                                                                     
----------------------------------------------------------------------------------------------------------------------------------------------------
 Aggregate  (cost=4.09..4.09 rows=1 width=0) (actual time=4457.886..4457.887 rows=1 loops=1)
   ->  Index Scan using idx_tbl_on_data_gist on tbl  (cost=0.00..4.09 rows=1 width=0) (actual time=4457.880..4457.880 rows=0 loops=1)
         Index Cond: ((data ? 'building_floorspace'::text) AND (data ?| '{elec_mean_monthly_use,gas_mean_monthly_use}'::text[]))
         Filter: ((id)::text = ANY ('{6d48fc431d21,d9e659e756ad}'::text[]))
 Total runtime: 4457.948 ms
(5 rows)

うーん、おそらく、最初に主キー部分だけでサブクエリを実行すると...: (いいえ、まだ 4.5 秒以上)

EXPLAIN ANALYZE SELECT COUNT(*) FROM (  SELECT * FROM tbl WHERE id IN ('6d48fc431d21', 'd9e659e756ad')  ) AS t WHERE data ? 'building_floorspace' AND data ?| ARRAY['elec_mean_monthly_use', 'gas_mean_monthly_use'];
                                                                     QUERY PLAN                                                                     
----------------------------------------------------------------------------------------------------------------------------------------------------
 Aggregate  (cost=4.09..4.09 rows=1 width=0) (actual time=4854.170..4854.171 rows=1 loops=1)
   ->  Index Scan using idx_tbl_on_data_gist on tbl  (cost=0.00..4.09 rows=1 width=0) (actual time=4854.165..4854.165 rows=0 loops=1)
         Index Cond: ((data ? 'building_floorspace'::text) AND (data ?| '{elec_mean_monthly_use,gas_mean_monthly_use}'::text[]))
         Filter: ((id)::text = ANY ('{6d48fc431d21,d9e659e756ad}'::text[]))
 Total runtime: 4854.220 ms
(5 rows)

Postgres がサブクエリをインライン化しないようにするにはどうすればよいですか?

背景: hstoreを使用し、GiST インデックスを持つ Postgres 9.1 テーブルがあります。

score 12 · Accepted Answer

OFFSET 0何か奇妙なことが起こっていることを示すハックであることは明らかであり、オプティマイザーの動作を変更する可能性は低いため、より良いアプローチだと思いますOFFSET 0... ~~CTEがいつかインライン化できるようになることを願っ~~ていますPostgreSQL 12. 以下の説明は完全を期すためのものです。Seamusの答えを使用してください。

非相関サブクエリの場合、PostgreSQL 11 以前のインラインクエリ用語の拒否を利用して、クエリを次のように言い換えることができます。WITH

WITH t AS (
    SELECT * FROM tbl WHERE id IN ('6d48fc431d21', 'd9e659e756ad')
)
SELECT COUNT(*) 
FROM t 
WHERE data ? 'building_floorspace' 
AND data ?| ARRAY['elec_mean_monthly_use', 'gas_mean_monthly_use'];

OFFSET 0これはハッキングとほぼ同じ効果があり、ハックoffset 0が Pg のオプティマイザーの癖を悪用するように、人々は Pg のクエリヒントの欠如を回避するために使用します...それらをクエリヒントとして使用します。

しかし、OFFSET 0CTE の悪用は PostgreSQL 12 では機能しなくなったのに対し、このハックは公式にはいくらか祝福されています (イェーイ!)。

score 7 · Accepted Answer

Postgres にインライン化しないように指示する方法があるようです: (0.223ms!)

EXPLAIN ANALYZE SELECT COUNT(*) FROM (  SELECT * FROM tbl WHERE id IN ('6d48fc431d21', 'd9e659e756ad') OFFSET 0 ) AS t WHERE data ? 'building_floorspace' AND data ?| ARRAY['elec_mean_monthly_use', 'gas_mean_monthly_use'];
                                                                QUERY PLAN                                                                
------------------------------------------------------------------------------------------------------------------------------------------
 Aggregate  (cost=8.14..8.15 rows=1 width=0) (actual time=0.165..0.166 rows=1 loops=1)
   ->  Subquery Scan on t  (cost=4.14..8.14 rows=1 width=0) (actual time=0.160..0.160 rows=0 loops=1)
         Filter: ((t.data ? 'building_floorspace'::text) AND (t.data ?| '{elec_mean_monthly_use,gas_mean_monthly_use}'::text[]))
         ->  Limit  (cost=4.14..8.13 rows=2 width=496) (actual time=0.086..0.092 rows=2 loops=1)
               ->  Bitmap Heap Scan on tbl  (cost=4.14..8.13 rows=2 width=496) (actual time=0.083..0.086 rows=2 loops=1)
                     Recheck Cond: ((id)::text = ANY ('{6d48fc431d21,d9e659e756ad}'::text[]))
                     ->  Bitmap Index Scan on tbl_pkey  (cost=0.00..4.14 rows=2 width=0) (actual time=0.068..0.068 rows=2 loops=1)
                           Index Cond: ((id)::text = ANY ('{6d48fc431d21,d9e659e756ad}'::text[]))
 Total runtime: 0.223 ms
(9 rows)

秘訣はOFFSET 0サブクエリにあります。

postgresql - Postgres がサブクエリをインライン化しないようにするにはどうすればよいですか?

2 に答える 2

Related

Reference