プランナーが入れ子になったループを使用することを決定した INNER JOIN を使用してクエリを実行しています。同じ結果を返すがネストされたループを使用しないように、異なる WHERE 条件でクエリを作成しようとしたため、WHERE 条件に関係があることがわかりました。
私の質問は、両方のクエリが同じ結果を返すため、クエリが同じように見えるのに、プランナーが異なる決定を下すことにしたのはなぜですか? クエリはネスト ループを使用して 77 秒で実行され、ネスト ループを使用せずに 13 秒で実行されます。13 秒で実行されるクエリは非常に見苦しく洗練されていないため、もっと良い書き方があると思います。
ここに 2 つのクエリがあります。2 つの違いは、WHERE 句が日付でフィルタリングする方法であることに注意してください。最初の句では BETWEEN が使用され、2 番目の句では一連の OR ステートメントが使用されます。current_date が独自のサブクエリにラップされているのは奇妙だと認識していますが、それはこれらのクエリが外部データ ラッパーを使用しているためです。これにより、 current_date を不変オブジェクトとして渡して、パフォーマンスを大幅に高速化できます。
SELECT ROUND(AVG(m.forecast - w.wind),6) from pjm.wind_forecast_recent w
INNER JOIN pjm.load_forecast_recent m ON w.pricedate = m.pricedate AND w.hour = m.hour
WHERE w.hour = 5 AND m.area = 'RTO_COMBINED' AND
(w.pricedate BETWEEN (SELECT current_date-6) AND (SELECT current_date));
-----------
SELECT ROUND(AVG(m.forecast - w.wind),6) from pjm.wind_forecast_recent w
INNER JOIN pjm.load_forecast_recent m ON w.pricedate = m.pricedate AND w.hour = m.hour
WHERE w.hour = 5 AND m.area = 'RTO_COMBINED' AND (
w.pricedate = (SELECT current_date-6) OR
w.pricedate = (SELECT current_date-5) OR
w.pricedate = (SELECT current_date-4) OR
w.pricedate = (SELECT current_date-3) OR
w.pricedate = (SELECT current_date-2) OR
w.pricedate = (SELECT current_date-1) OR
w.pricedate = (SELECT current_date))
それぞれの EXPLAIN ANALYZE は次のとおりです。
Aggregate (cost=842341.01..842341.02 rows=1 width=32) (actual time=77120.088..77120.089 rows=1 loops=1)
InitPlan 1 (returns $0)
-> Result (cost=0.00..0.01 rows=1 width=4) (actual time=0.007..0.008 rows=1 loops=1)
InitPlan 2 (returns $1)
-> Result (cost=0.00..0.01 rows=1 width=4) (actual time=0.001..0.001 rows=1 loops=1)
-> Nested Loop (cost=840333.25..842340.97 rows=1 width=18) (actual time=14719.661..77119.994 rows=7 loops=1)
-> Foreign Scan on wind_forecast_recent w (cost=242218.45..242218.49 rows=1 width=18) (actual time=3184.714..3184.720 rows=7 loops=1)
-> Foreign Scan on load_forecast_recent m (cost=598114.80..600122.47 rows=1 width=16) (actual time=10531.723..10531.724 rows=1 loops=7)
Planning Time: 744.979 ms
Execution Time: 77227.512 ms
Aggregate (cost=841657.94..841657.95 rows=1 width=32) (actual time=13683.022..13683.023 rows=1 loops=1)
InitPlan 1 (returns $0)
-> Result (cost=0.00..0.01 rows=1 width=4) (actual time=0.006..0.006 rows=1 loops=1)
InitPlan 2 (returns $1)
-> Result (cost=0.00..0.01 rows=1 width=4) (actual time=0.001..0.001 rows=1 loops=1)
InitPlan 3 (returns $2)
-> Result (cost=0.00..0.01 rows=1 width=4) (actual time=0.001..0.001 rows=1 loops=1)
InitPlan 4 (returns $3)
-> Result (cost=0.00..0.01 rows=1 width=4) (actual time=0.001..0.001 rows=1 loops=1)
InitPlan 5 (returns $4)
-> Result (cost=0.00..0.01 rows=1 width=4) (actual time=0.001..0.001 rows=1 loops=1)
InitPlan 6 (returns $5)
-> Result (cost=0.00..0.01 rows=1 width=4) (actual time=0.001..0.001 rows=1 loops=1)
InitPlan 7 (returns $6)
-> Result (cost=0.00..0.01 rows=1 width=4) (actual time=0.001..0.001 rows=1 loops=1)
-> Foreign Scan (cost=833725.15..841657.83 rows=1 width=18) (actual time=13682.974..13682.977 rows=7 loops=1)
Relations: (pjm.wind_forecast_recent w) INNER JOIN (pjm.load_forecast_recent m)
Planning Time: 332.870 ms
JIT:
Functions: 16
Options: Inlining true, Optimization true, Expressions true, Deforming true
Timing: Generation 4.163 ms, Inlining 15.088 ms, Optimization 44.489 ms, Emission 28.064 ms, Total 91.804 ms
Execution Time: 13724.094 ms
Ubuntu 18.04 サーバーで PostgreSQL 12.1 を実行しています。
ご不明な点がございましたら、お気軽にお問い合わせください。ありがとう!