10

webapp()環境のGreenplum代わりに使用することの賛否両論は何ですか?PostgreSQLdjango

私の直感的な反応は、PostgreSQLのオープンソースアプローチと膨大な知識ベースを好むことです。

私の構成(他の構成については聞きたいですが)は、2つのWebサーバーと(現時点では)2つのデータベースサーバーを備えた中規模の企業です。

対照的な領域は、バイナリdata crunching、ノード数、replicationおよび私の個人的なお気に入りですcommunitiy support。熟練したエンジニアのサポートです。

PostgreSQLの代わりにGreenplumを使用することの長所と短所は何ですか?

4

7 に答える 7

11

Greenplum については、あなたが送ったリンクをざっと目を通しただけで、あまり知りません。データ ウェアハウスは、トランザクション オペレーショナル データ ストアと同じではありません。前者は、アドホック クエリ、統計分析、次元分析、履歴データへの読み取りアクセスが主な目的です。後者は、運用データのリアルタイムの読み取り/書き込み用です。無料です。

PostgreSQLが必要だと思います。

Greenplum をあなたに押し付けているのは誰ですか? その理由は? それが代替案として提示されている場合、私はより深く掘り下げて議論に反論します.

于 2011-03-15T11:33:53.537 に答える
8

Greenplum は PostgreSQL の MPP 適応です。大規模なデータ セットのウェアハウジングや分析用に最適化されており、トランザクション環境ではうまく機能しません。大規模な DW 環境が必要な場合は、Greenplum を参照してください。OLTP またはより小さい DB サイズ (10 TB 未満) が必要な場合は、PostgreSQL を検討してください。

于 2011-09-27T15:35:52.103 に答える
4

Greenplum は、MPP 分析 (OLAP) DBMS です。PostgreSQL は OLTP DBMS です。一般に、市場には OLAP と OLTP の両方を同時に処理できる単一のソリューションはありません。ここで私の考えを見つけることができます。

WebApp バックエンドは常に OLTP ワークロードを作成します。Greenplum は分散システムであるため、トランザクション処理のオーバーヘッドが大きいため、500 ~ 600 TPS を超えるとは思わないでください。対照的に、Postgres は、適切なチューニングを行うことで数十万の TPS に到達できます。

対照的に、OLAP ワークロードが必要な場合、Postgres は単一のホスト処理のみを提供し、動的パーティション除去によるパーティション分割、圧縮、列型ストアは提供しません。一方、Greenplum はクラスター上でデータを並列処理できます。

したがって、探しているソリューションは、典型的なデータ ウェアハウスのケースです。トランザクションのワークロードが高い場合は OLTP ソリューションを使用し、ETL/ELT を使用してデータを DWH に抽出し、それに対して複雑なデータ処理クエリを実行します。

現時点では、PostgreSQL と Greenplum の両方がオープン ソース製品であるため、どちらを選択してもかまいませんが、PostgreSQL コミュニティはより大きな ATM です。

于 2015-11-23T12:43:43.090 に答える
3

Greenplum は並列処理を利用するため、マスター ノードはこれらすべてのクエリに対する回答を取得するために、基礎となるデータ ノードと通信する必要があるため、多数の小さな読み取りクエリを実行するとオーバーヘッドが発生します。ミリ秒かかるクエリの場合、Greenplum のパフォーマンスは桁違いに遅くなることが予想されます。

于 2011-03-15T13:27:11.370 に答える
3

PostgreSQL ベースのデータ ウェアハウジング ソリューションを探している場合は、GridSQL も検討します。これは、複数の PostgreSQL インスタンスにわたる並列化レイヤーであり、無料のオープン ソースです。

他のコメントで述べたように、多くの小さなミリ秒のクエリではうまく機能しませんが、長時間実行されるクエリには大いに役立ちます。GridSQL には、Greenplum が持つ列指向ストレージのような DW 最適化も含まれませんが、並列処理と組み合わせた制約除外パーティショニング (例: 日付範囲によるサブテーブル) を利用して、クエリ結果をより高速に取得できます。

PostgreSQL はクエリを処理するときに単一のコアのみを使用するため、単一のマルチコア サーバーで使用することもできます。

于 2011-03-16T11:51:54.630 に答える
2

Greenplumは並列処理をより有効に活用していると思います。ただし、これはPostgreSQLに基づいています。

Greenplumには無料のコミュニティエディションがあります。いつでも自分の環境でダウンロードしてテストできます。

于 2011-03-15T13:20:38.373 に答える
1

データ処理に 1 時間以上かかる場合は、コアを追加するたびにパフォーマンスが直線的に向上します。やり遂げるのに時間がかからないものは、努力する価値がありません。

于 2011-05-12T16:51:28.057 に答える