4mil以上のレコードを持つテーブルがあります。1日を通してETLプロセスを介してデータで更新されるステージングテーブルがあります。ステージングテーブルが更新されたら、そのデータを本番テーブルと同期する必要があります。現在、INSERT / ON DUPLICATE KEY UPDATEクエリを使用して同期していますが、このテーブルのサイズでは、実行に最大750秒かかります。新しいデータを更新/挿入するためのより効率的な方法はありますか?テーブルのパーティション分割についていくつか読んだことがありますが、それが必要かどうかはわかりません。これをより効率的に達成する方法について誰かが私にいくつかの提案をすることができますか?
1 に答える
0
maatkitツール(http://www.maatkit.org/)、具体的にはhttp://www.maatkit.org/doc/mk-table-sync.htmlを使用します。この種のことではかなり効率的です。
于 2011-06-03T16:25:26.577 に答える