ログ ファイルからの情報を格納する Postgres テーブルの最適化に取り組んでいます。
クエリは次のとおりです。
SELECT c_ip as ip
, x_ctx as file_name
, date_time
, live
, c_user_agent as user_agent
FROM events
WHERE x_event = 'play'
AND date = '2012-12-01'
AND username = 'testing'
x_event、date、および username には b-tree インデックスがあります。このテーブルには、約 2500 万行あります。現在、クエリには約 20 ~ 25 (修正、40 秒程度) かかり、143,000 行が返されます。
その時間は予想されますか?インデックスのおかげでもっと速いと思っていたでしょう。おそらく、通過しなければならない膨大な量のデータのためでしょうか?
編集:これがEXPLAIN ANALYZEです:
Bitmap Heap Scan on events (cost=251347.32..373829.74 rows=35190 width=56) (actual time=5768.409..6124.313 rows=143061 loops=1)
Recheck Cond: ((date = '2012-12-01'::date) AND (username = 'testing'::text) AND (x_event = 'play'::text))
-> BitmapAnd (cost=251347.32..251347.32 rows=35190 width=0) (actual time=5762.083..5762.083 rows=0 loops=1)
-> Bitmap Index Scan on index_events_fresh_date (cost=0.00..10247.04 rows=554137 width=0) (actual time=57.568..57.568 rows=572221 loops=1)
Index Cond: (date = '2012-12-01'::date)
-> Bitmap Index Scan on index_events_fresh_username (cost=0.00..116960.55 rows=6328206 width=0) (actual time=3184.053..3184.053 rows=6245831 loops=1)
Index Cond: (username = 'testing'::text)
-> Bitmap Index Scan on index_events_fresh_x_event (cost=0.00..124112.84 rows=6328206 width=0) (actual time=2478.919..2478.919 rows=6245841 loops=1)
Index Cond: (x_event = 'play'::text)
Total runtime: 6148.313 ms
それについていくつか質問があります:
- 日付インデックスに 554137 行あるというのは正しいですか? そこにあるはずの日付は50未満です。
- リストされている 3 つのインデックスのうち、どのインデックスを使用しているかを知るにはどうすればよいですか?
- リストされた合計実行時間は約 6 秒でしたが、EXPLAIN ANALYZE なしでクエリを実行すると、約 40 秒かかります。