問題タブ [greenplum]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
database - 200 億行/月 - Hbase / Hive / Greenplum / What?
データ ウェアハウス システムの適切なソリューションを選択するために、あなたの知恵を活用したいと思います。問題をよりよく理解するための詳細を次に示します。
データは、1 つの BIG ファクトと最大 15 のディメンションを持つスター スキーマ構造で編成されます。
1 か月あたり 200 億のファクト行
10 次元で 100 行 (ある程度の階層)
5 次元で数千行
2 次元で ~200K 行
2 つの大きな次元で 50M ~ 100M 行
この DB に対して実行される 2 つの典型的なクエリ
dimq の上位メンバー:
タプル対策:
質問:
- そのようなクエリを実行するのに最適なプラットフォームは何ですか
- 必要なハードウェアの種類
どこでホストできますか (EC2?)
(現時点では、インポートと読み込みの問題は無視してください)
Tnx、
ハガイ。
database - エラー:セグメント接続に失敗しました:allocateWriterGangが不正なギャングを返そうとしました。(cdbgang.c:2591)
SolarisでのGreenplumデータベースバージョン3.2.3の使用。
手順1.テーブルを作成します。
ステップ2:別のテーブルからデータを挿入します。(これは単純なバニラであり、パーティション化されておらず、制約もありません。564,392,723行あります。)
結果:
悪いギャングの事はショー全体を停止させます、事を再びきれいにするためにデータベースを再起動する必要があります。
ウェブ上であまり見つけていないので、ヘルプデスクのチケットをグリーンプラムで開いてもらいましょう。ここでもそれを浮かび上がらせようと思いました。あなたがする前に私が解決策を手に入れたら、解決策を持って戻ってきます。
申し訳ありませんが、「greenplum」でタグ付けするのに十分な担当者がいません。
sql - Greenplum: segDB から SQL ステートメントを実行する関数はまだサポートされていません
SNE GP Edition のテーブルの 1 つで設定された Insert Trigger から関数を呼び出そうとすると、次のエラーが発生します。
これの原因は何ですか?トリガー + 関数は、同じ DB 内の別のテーブルで完全に正常に機能しています。
前もって感謝します!
Rgds、キラン
sql - GreenplumとPostgreSQL
webapp()環境のGreenplum
代わりに使用することの賛否両論は何ですか?PostgreSQL
django
私の直感的な反応は、PostgreSQLのオープンソースアプローチと膨大な知識ベースを好むことです。
私の構成(他の構成については聞きたいですが)は、2つのWebサーバーと(現時点では)2つのデータベースサーバーを備えた中規模の企業です。
対照的な領域は、バイナリdata crunching
、ノード数、replication
および私の個人的なお気に入りですcommunitiy support
。熟練したエンジニアのサポートです。
PostgreSQLの代わりにGreenplumを使用することの長所と短所は何ですか?
postgresql - テーブルのタイムスタンプ フィールドにある一意の日付を確認する最速の方法は?
数十億行のテーブルがあります。「タイムゾーンなしのタイムスタンプ」である「記録済み」フィールドには、毎日のパーティションがあります。現在表にある日を知りたいです。私は次のようなことができることを知っています:
これは理想的には機能するはずですが、それに関する説明はかなり高く、機能するのにかなりの時間がかかることを示しています...それが私にできる最善のことであれば、それを受け入れることができます(データをそのまま監視することができます)入ります)、しかし、毎日のパーティション分割があることを考えると、これを行うためのより効率的な方法があるかどうか疑問に思っていましたか?
python - DB2 DB から greenplum DB へのデータの転送
私の会社は [Greenplum] を使用してデータマートを実装することを決定しました。既存の [DB2] DB から Greenplum DB に転送されるデータ量の概算値は、約 2 TB です。
知りたいこと: 1) Greenplum DB はバニラ [PostgresSQL] と同じですか? (私は Postgres AS 8.3 で作業しました) 2) このタスク (抽出とインポート) に使用できる (無料の) ツールはありますか 3) Python の知識があります。合理的な時間内にこれを行うのは簡単ですか?
これを行う方法がわかりません。アドバイス、ヒント、提案は大歓迎です。
jdbc - jdbcでのpostgresql/greenplumパラメータバインディング、なぜ列名だと思うのですか?
次のようなクエリがあります。
param :p_name がFOOに設定されている場合、次のようなエラーが発生します。
[42703] エラー: 列 "FOO" が存在しません
一重引用符「FOO」を含めるように手動で設定すると、機能します。
エスケープされた一重引用符をパディングしようとしました。quote_* 関数を試しました。「@」、「$」、「?」を使用して検索しました。パラメータの種類。これがどんどん出てきます。
編集
できる限り排除して、IntelliJのSQLコンソールから次のことを試しました
そして、エディットボックスにパラメータ「Foo」を追加します。3 つのケースすべてで、同じ問題が発生します。編集ボックスに「Foo」を追加すると、期待どおりの結果が得られます。
私もプリペアードステートメントと ? を使用しました。:p1 を使用した callableStatement ではなく、同じ結果が得られました。
私は何を間違っていますか?
編集
JDBC URL から「stringtype=unspecified」を削除すると、問題が解決するようです。これが、スニペットや他の人のコードをコピーして、それがうまくいくと思い込んではいけない理由です。
database - クエリで使用されていない Greenplum インデックス
列 C (btree index) に作成されたインデックスを持つテーブル T を作成しましたが、選択クエリを実行すると、このインデックスは使用されません。
元:
これは、作成したインデックスを考慮せずに、すべてのセグメントを順番に検索します。
次のフラグを使用しました
何か不足していますか?親切に説明してください?
ありがとうガネーシュ.R
copy - Greenplum COPY が重複エントリをフィルタリングしない
COPY コマンドを使用して緑のプラム テーブルにコンテンツをロードする際に問題があります。私が持っているのは、 A 、 B 、 C と言う 3 つの列のテーブルであり、テーブルは重複する要素を楽しませてはなりません。だから私は上記の3つをクラビングする複合キーを作りました
しかし、テーブルをロードするために使用している入力ファイルには重複したエントリがあります。私が欲しいのは、重複する要素をフィルター処理してデータの読み込みを続行するための COPY コマンドだけです。しかし、私の場合、COPY が重複するエントリに遭遇するたびに、読み込みを中止します。続行する方法についての手がかりはありますか??
ありがとう
ガネーシャR
r - PostgreSQLでのrodbc文字エンコードエラー
RODBCを使用してRからGreenPlumPostgreSQLデータベースに接続すると、これまでに発生したことのない新しいエラーが発生します。EMACS / ESSとRStudioの両方を使用してエラーが発生しましたが、RODBC呼び出しは以前と同じように機能しました。
編集:別のテーブルにクエリを実行してみたところ、結果が得られました。したがって、これはRODBCの問題ではなく、PostgreSQLのテーブルエンコーディングの問題だと思います。