1

1 日ごとにパーティション分割されたデータを含む postgresql 運用 DB と、postgresql データ ウェアハウス DB があります。運用データベースから DWH にデータをすばやくコピーするために、テーブルをできるだけ速くコピーし、使用するリソースを最小限に抑えたいと考えています。テーブルは日ごとに分割されているため、各パーティションはそれ自体がテーブルであることがわかります。これは、マシン間でデータ ファイルを何らかの形でコピーし、それらのデータ ファイルを使用して DWH にテーブルを作成できるということですか? その場合のベストプラクティスは何ですか?

編集: ここで尋ねられたすべての質問に答えます: 1. ETL を構築しています。ETLの第一歩は、運用DBへの影響が少ないデータをコピーすることです。2. 運用 DB の書き込みが遅くならない場合は、データを複製したいと思います。3. もう少しデータを追加します。運用 DB は私の回答ではありませんが、主な関心事はその DB への書き込み時間です。1 日に約 5 億行を書き込みます。負荷の高い時間もありますが、まったく書き込みがない時間はありません。4. レプリケーション、pg_dump など、いくつかのツール/方法を見つけました。しかし、ツールを比較して、いつ何を使用するかを知り、自分のケースに何が適しているかを理解するものを見つけることができませんでした.

4

2 に答える 2

2

一括転送を行う場合は、実際にウェアハウスシステムでpg_dumpを実行し、結果を1日1回psqlにパイプすることを検討します。おそらくSlonyも実行できますが、そのwoudlはより多くのリソースを必要とし、おそらくより複雑になります。

于 2012-08-29T15:55:58.560 に答える
1

データベース間でデータをレプリケートするには、多くの優れた方法があります。ただ探している間に

データベース間のテーブルの高速転送

...拡張機能dblinkによってシンプルで高速なソリューションが提供されます。ここSOには多くの例があります。検索してみてください。

より広いアプローチが必要な場合は、継続的な同期など、レプリケーション用の確立されたツールの 1 つを検討してください。マニュアルには、開始するための優れた比較があります。

于 2012-08-29T20:04:28.017 に答える