2

私は2つのテーブルを持っています-

テーブルA:1MM行、AsOfDate、Id、BId(テーブルBへの外部キー)

表B:50k行、Id、Flag、ValidFrom、ValidTo

表Aには、100のBIdにわたる2011/01/01から2011/12/31までの1日あたりの複数のレコードが含まれています。表Bには、100入札の重複しない(validfromとvalidtoの間の)複数のレコードが含まれています。

結合のタスクは、指定されたAsOfDateでBIdに対してアクティブだったフラグを返すことです。

select 
    a.AsOfDate, b.Flag 
from 
    A a inner Join B b on 
        a.BId = b.BId and b.ValidFrom <= a.AsOfDate and b.ValidTo >= a.AsOfDate
where
    a.AsOfDate >= 20110101 and a.AsOfDate <= 20111231

このクエリは、64Gbのメモリを搭載した非常にハイエンドのサーバー(+ 3Ghz)で約70秒かかります。

私はこれをテストしているので、フィールドのすべての組み合わせにインデックスがあります-無駄です。

インデックス:a.AsOfDate、a.AsOfDate + a.bId、a.bidインデックス:b.bid、b.bid + b.validfrom

以下に提案されている範囲クエリも試してみました(62秒)

VMで実行されている無料バージョンのSQLServerでのこの同じクエリは、完了するまでに最大1秒かかります。

何か案は?

Postgres 9.2

クエリプラン

QUERY PLAN                                       
---------------------------------------------------------------------------------------
Aggregate  (cost=8274298.83..8274298.84 rows=1 width=0)
->  Hash Join  (cost=1692.25..8137039.36 rows=54903787 width=0)
    Hash Cond: (a.bid = b.bid)
     Join Filter: ((b.validfrom <= a.asofdate) AND (b.validto >= a.asofdate))
     ->  Seq Scan on "A" a  (cost=0.00..37727.00 rows=986467 width=12)
           Filter: ((asofdate > 20110101) AND (asofdate < 20111231))
     ->  Hash  (cost=821.00..821.00 rows=50100 width=12)
           ->  Seq Scan on "B" b  (cost=0.00..821.00 rows=50100 width=12)

分析出力については、http://explain.depesz.com/s/1c5を参照してください。

これは、同じクエリに対するsqlserverからのクエリプランです。

4

2 に答える 2

0

postgresql9.2で利用可能な範囲タイプの使用を検討してください。

create index on a using gist(int4range(asofdate, asofdate, '[]'));
create index on b using gist(int4range(validfrom, validto, '[]'));

次のように、一致する範囲の日付をクエリできます。

select * from a
where int4range(asofdate,asofdate,'[]') && int4range(20110101, 20111231, '[]');

そして、bの行が次のようにレコードとオーバーラップする場合:

select *
from b
    join a on int4range(b.validfrom,b.validto,'[]') @> a.asofdate
where a.id = 1

&&「オーバーラップ」を@>意味し、「含む」を意味'[]'し、両方のエンドポイントを含む範囲を作成することを示します)

于 2012-10-26T14:46:41.320 に答える
0

問題はインデックスにありました-何らかの理由で私にはわかりませんでした、テーブルのインデックスはクエリアナライザによって正しく参照されていませんでした-私はそれらをすべて削除し、(まったく同じです-スクリプトを介して)追加し直しました、そしてクエリは今〜303ms。

この非常に苛立たしい問題についてのすべての助けに感謝します。

于 2012-11-08T15:32:18.807 に答える