hadoop - Hadoop 側からの関係データベース内のデータの検索

翻译自：https://stackoverflow.com/questions/19176206 2013-10-04T08:01:30.907

238 次

データウェアハウスでの ETL 処理のために、SSIS ソリューションを Hadoop に変換しています。

私の期待するシステム:
ETL - ランディング & ステージング (Hadoop) ----put-data---> Data-warehouse(MySQL)

問題は、transform 句では、Hadoop 側 (pig または mapreduce ジョブ) から MySQL のデータを検索する必要があることです。2 つの解決策があります。
1 つ目: MySQL から Hadoop にルックアップする必要があるすべてのテーブルをクローンします。これは、2 つの場所からデータを維持する必要があることを意味します。
2 番目: MySQL に直接クエリを実行します。MySQL サーバーに多くの接続が来るのが心配です。

この問題の解決策/ベストプラクティスは何ですか? 他の解決策はありますか。

hadoop - Hadoop 側からの関係データベース内のデータの検索

1 に答える 1

Related

Reference