6

Rails アプリケーションのデータを、複数のプロバイダー (REST/SOAP ベースの XML フィード) からデータベースに定期的にロードする必要があります。毎回生成される cron ジョブによって開始される一連の Rake タスクを作成しました。各タスクはパートナー フィード エンドポイントに到達し、フィードを解析してデータベースに読み込みます。

Rake タスクを作成する代わりに、ActiveWarehouse ( http://activewarehouse.rubyforge.org/etl/ ) のような ETL フレームワークを使用する必要がありますか? Railsでこれを行う最善の方法について何か提案はありますか?

4

1 に答える 1

3

データを一連のテーブルにロードするだけで、新しいレコードの追加や基本的なレコードの更新などの単純なユース ケースであり、ロードが要件を満たしている場合は、そのまま使用します。確かに ActiveWarehouse も使用できますが、やり過ぎのように思えます。ただし、ディメンションの変更 (つまり、時間の経過に伴うデータ変更の履歴を保存する) やその他の「データ ウェアハウス」機能をサポートする必要がある場合は、ActiveWarehouse のようなものがより価値を持ち始めます。

于 2012-03-16T15:04:04.860 に答える