私は高評価の回答に同意しますが、次のように追加すると思いました。
* Do you use a staging area to perform the transformation and then
倉庫に積み込みますか?
ステージングが必要かどうかは、変換のタイプによって異なります。ステージングには、ETLをより管理しやすいチャンクに分割するという利点がありますが、ウェアハウスに影響を与えることなくデータに対して操作を実行できる作業領域も提供されます。ファクトレコードをロードするときにルックアップとして使用するために、OLTPシステムからのキーと最新のdimレコードのキーを格納するステージング領域に(少なくとも)いくつかのディメンションルックアップを含めると役立ちます。変換はETLプロセス自体で発生しますが、途中でそれを支援するためにステージングが必要な場合と必要でない場合があります。
* How do you link data between the warehouse and the OLTP database?
OLTPシステムへの参照として、ビジネスキー(または使用可能な場合は実際の主キー)をデータウェアハウスにロードすると便利です。また、DWプロセスでの監査では、データをロードしたロードプロセスを記録することにより、データの各ビットの系統を記録する必要があります。
* Where/How do you manage the transformation process - in the
sprocs、dts / ssisパッケージ、またはアプリケーションコードからのSQLとしてのデータベース?
これは通常、SSISパッケージに含まれますが、多くの場合、ソースクエリで変換する方がパフォーマンスが高くなります。残念ながら、これによりソースクエリの理解と維持が非常に複雑になるため、パフォーマンスが問題にならない場合は、SSISコードで変換するのが最適です。これを行うと、これがステージング領域を持つもう1つの理由になります。これにより、異なるテーブル間のソースクエリでより多くの結合を行うことができます。