5

これは、技術的な問題というよりは、アーキテクチャの問題です。

私は現在、大量のデータを保存し、そのデータを使用して分析 (消費者行動) を引き出す必要があるビジネス Web サイト/ソーシャル ネットワークを構築しています。

Django と PostgreSQL データベースを使用しています。

ここでの質問は、このアーキテクチャを拡張してデータ ウェアハウスを含めたいということです。理想は次のとおりです。運用 DB は現在の Django PostgreSQL データベースであり、データ ウェアハウスは追加の何かであり、できれば多次元モデルです。

私たちはまだ非常に初期段階にあり、50 人のユーザーでテストする予定なので、初心者向けの 1 列のテーブルなどの基本的なもので十分です。

誰かがこの状況で経験を積んでいるかどうかを知りたいのですが、(可能であれば) 使いやすさのために Django モデルを使用して運用 DB を維持しながら、データ ウェアハウスを作成するためのフレームワークを勧めてくれます。

前もって感謝します!

4

2 に答える 2

6

私が最近使用したいくつかのクールなオープン ソース ツールを次に示します。

  • Kettle - 優れた ETL ツールです。これを使用して、運用データベースからウェアハウスにデータを抽出できます。JDBC ドライバーを使用して任意のデータベースをサポートし、スター スキーマなどの構築を非常に簡単にします。
  • Saiku - Pentaho Mondrian (MDX 実装)上に構築された素敵な Web 2.0 フロントエンド。これにより、ユーザーは複雑な集計クエリ (Excel のピボット テーブルを考えてください) を簡単に作成でき、Mondrian レイヤーはキャッシングなどを提供して処理を高速化します。こちらでデモをお試しください。
于 2012-04-11T19:10:56.960 に答える
0

私の答えは必ずしもデータ ウェアハウジングには当てはまりません。あなたの場合、OLTP リレーショナル ストレージ (この場合は PostgreSQL) と一緒にNoSQLデータベース ソリューションを実装する可能性があると思います。

NoSQL を検討する理由 明らかなスケーラビリティの利点に加えて、NoSQL には、おそらくシナリオに適用できる多くの利点があります。たとえば、さまざまなフィールドのセットを持つレコードを持つ柔軟性と、キーベースのアクセスです。

まだ「試用」段階にあるため、ホスティング プロバイダーによっては、NoSQL データベース ソリューションを選択する方が簡単な場合があります。たとえば、AWSにはSimpleDBがあり、Google App Engineには独自のDataStoreなどが用意されています。ただし、優れた Python バインディングを持つ NoSQL ソリューションは他にもたくさんあります。

于 2012-04-10T15:34:57.233 に答える