お得な情報はこちら? 私はPentahoを試していませんが、チェックアウトする予定です. 私は経験豊富な MS BI コンサルタントで、1998 年から使用しています。SSIS は非常に高速で非常に強力ですが、批判は的を射ています。SSIS で次の問題が見つかりました。
(1) デバッグが難しく、問題が実際にどこにあるのかについてのヒントが得られない可能性のある不可解なエラーが発生します。
(2) 以前のコメントによると、これまでで最もくだらない開発環境です! 彼らが何を考えているのか私にはわかりません。
(a) 100 列以上のテーブルを作成し、マージ結合を配置します。ここで戻って、マージ結合を更新してみます (新しい列をプルするなど)。マージ結合で [OK] をクリックして変更を保存した後、最速のマシンでも数分かかる場合があります。多数のワイド レコードと多数のマージ結合を含む巨大なデータフローがあります。データフローに 1 つの列を追加するには、半日以上かかります。マージ結合を更新した後、別のことをしなければならず、5 ~ 10 分後にもう一度チェックして、それが完了したかどうかを確認します。これに対するマイクロソフトの対応は、パッケージを複数のパッケージに分割し、それらの間のテーブルまたはバイナリにデータを配置することです。すべてのステップの間にディスクを作成する場合は、SQL ですべてを実行することをお勧めします。
(b) デザイナーが完全にクラッシュすることがあり、最後の保存以降のすべての作業が失われます (このため、今は睡眠中に ctrl-S を実行しています)
(c) ハックを見つけ出し、ワイド レコード用に Excel で SSIS パッケージ XML を生成する必要がありました。600 以上の列レコードが一般的なヘルスケア クライアントがあります。SSIS で 600 列のファイル形式を定義しようとすると、すべての列を 1 つずつ入力する必要があります!!! MS アクセスでも、レイアウトをスプレッドシートからファイル レイアウトにカット アンド ペーストできますが、SSIS はできません。そのため、レイアウトから XML を生成し、XML コードをパッケージ内の適切な場所に貼り付ける必要がありました。醜い方法ですが、丸一日の作業と多くのエラーを節約できました。
(d) (c) と同様に、すべての列を削除する必要があり、その数が 600 以上あるとしたらどうでしょう。派生列コンポーネントでは、trim(column1) を 600 回以上入力する必要があります。データは Excel シートから簡単に生成できるため、SQL クエリでこのような単純な変換をすべて実行してデータを取得します。
(e) 多くの風変わりなもの、目に見えないコンポーネントがあり、パッケージを開くと、すべてのコンポーネントが一貫性を欠いて完全に再配置されることがあります。
(f) おそらく ETL で必要とされる最も一般的な機能の 1 つである FTP 機能は弱く、誰も使用しないプレーンなバニラ FTP しかサポートしていません。最近は誰もが SFTP、FTPS、https などを使用しています。したがって、ほとんどすべての実装では、パッケージが呼び出す必要があるサードパーティのコマンド ライン駆動のファイル転送アプリを使用する必要があります。
(g) Microsoft は、Windows Vista のばかげたセキュリティと同様に、CYA を試みて、ある環境から別の環境に SSIS パッケージを実際にプロモートすることを非常に困難にしました。デフォルトでは、「機密情報をユーザーキーで暗号化する」セキュリティという愚かなことに設定されています。つまり、移動先の環境で、開発した環境と同じアカウントで実行する必要がありますが、これはめったにありません。より良い設定方法がありますが、常にこの完全に役に立たないセキュリティ保護に戻ろうとします。
(h) 最後に、これらの問題のほとんどは現在第 3 バージョンにあり、Microsoft がそれらを修正する計画がないことを明確に示しています。
(i) デバッグは他の言語ほど簡単ではありません。
SSIS には依然として非常に多くの利点がありますが、深刻な問題がないわけではありません。