SQL Server データベースにロードする前に、ETL プロセスのいくつかの段階で変換および集約する必要があるさまざまなフラット ファイルを受け取ります。
各段階の後、いくつかの方法でデータを検証したいと考えており、役立つ既存の技術を調べています。
データを受信したら、切り捨てられたデータ、日付の書式設定などについて検証し、一般的にデータが変換の準備が整っていることを確認する必要があります。
このようにデータがきれいになったら、データを検証したいと思います。これは、行数、% null、平均値などの値を以前のロードまたは事前定義された値と比較することで構成されます。検証に失敗した場合は、開発者に警告する必要があります。
データベースユニットテストフレームワークであるtSQLtには、私が望むことを行うために使用できるいくつかのアサーションがあります。セットアップは簡単で、適切なドキュメントがあります。これは私が見ることができる最も近いツールですが、設計されたものとはかけ離れています。
別の方法は、独自のツールを作成することですが、知りたいのですが、このようなものは既に存在しますか?