1

現在、レプリケートされたデータを頻繁に受信する 5 つのテーブルがあります。PL/SQL は、複雑なビジネス ロジックに基づいて、このデータを変換、クレンジング、および集計するために使用されます。結果は、3 つのレポート テーブルに配置されます。

これには、リレーショナル データベースの代わりに MongoDB を使用することに興味があります。そのためには、すべての PL/SQL ビジネス ロジックを Java などの別の言語に翻訳する必要があります。

ただし、Hadoop は MongoDB よりも優れた代替手段であることが示唆されています。今、Hadoop と Mapreduce について学んでいますが、Hadoop はビジネス ロジックに基づいてデータを変換するためではなく、データの分析 (データから統計値を導出する、つまり顧客の行動間の相関関係) に使用されているように感じます。

現状のシステムを Hadoop に置き換えるには、すべての PL/SQL ビジネス ロジックを mapreduce 関数に変換する必要があると思います。この仮定は間違っていますか?

私の個人的な状況に関係なく、Hadoop (および mapreduce) が処理できず、PL/SQL または Java が処理できるビジネス ロジックはありますか?

4

2 に答える 2

1

まず、MongoDB は NoSql データベースの一種であり、Hadoop は一種の並列処理フレームワークです。実際にテラ/ペタ バイトのデータがある場合は、並列処理フレームワークを使用するのが妥当です。そして、Nosql データベース + 並列処理フレームワークを使用しても問題ないか、データを参照してください。

  1. PL/SQL ビジネス ロジックを mapreduce 関数に変換できます。
  2. Hadoop は、インデックス作成、集中処理の場合、あらゆるビジネス ロジックのロット ロスを処理できます (非トランザクション システムの場合)。

また、ハイブを調べることをお勧めします。

于 2013-10-18T20:49:15.923 に答える
0

MongoDB+Hadoopが使えることを確認できました。すべてのパッケージの変換ロジック全体を横に置き、入力、出力、フロー (依存関係) を特定してからマップ リデュースに変換するだけです。主要なタスクは、変換ロジックからキー、値、ルールを特定することです。豚も使って頂ければ幸いです。抽出には Sqoop を使用します。

于 2015-04-30T07:01:04.620 に答える