3

私の会社のほとんどは、データベース間の Extract-Transform-Load タイプのデータ移動ジョブに powercenter informatica を使用しています。

ただし、私が取り組んでいるプロジェクトには、データを移動して他の更新をトリガーするための適切な手段として、Java が投入された大きなカスタム Perl ジョブがあります。

代わりに powercenter を使用するように書き直すという話がありますが、そのようなプロジェクトに関する人々の経験は何ですか?それは理にかなっていますか? このような「既製」のソリューションに移行することで、多くの柔軟性を犠牲にしているように見えますが、ETL ツールは、たとえば生産性の面で大きなメリットをもたらしますか?

4

5 に答える 5

7

インフォマティカは運用チームに適しています。これにより、技術者以外の人がジョブを監視して再実行することができます。ただし、必要以上に複雑な作業になります。これは巨大なソフトウェアであり、習得には時間がかかり、プログラミングなしで実行できる変換は限られています。私は、「エンタープライズ ETL」ツールよりも、Perl やプログラミング言語をいつでも使用したいと思っています。

于 2009-08-06T00:07:57.380 に答える
4

2001 年から Informatica と Tibco があり、人々は (基本的なタスクのために) Informatica を簡単に手に入れることができましたが、Tibco は苦痛でした。Tibco はなくなり、Informatica のフットプリントは拡大し、そのコードは現在、ビジネス アナリストによってさえ見られるようになっています..

習熟すると、多くのことをすばやく行うことができます (私は、1 週間で複数のソースから 3 つのファクト テーブルと 12 のディメンションを作成しました。これは、財務および PO データ マートの場合です)。また、コードの変更、スケジューリング、移行時のメンテナンスが容易になります。別の開発者など。楽しむ時間が減り、会議や組織の事務処理に多くの時間が費やされます。

データ マート、データ移動、および ASP へのインターフェイスに使用します。

コンパイルされた C プログラムの代わりに、完全にカスタマイズしたい場合は、Java 変換を使用できるようになりました。

于 2009-09-01T00:00:12.300 に答える
2

あなたの場合、影響分析 (SLA) と保守 (監視、単一の ETL ツール) という 2 つの理由で Informatica に変更します。再利用性もプラスです。

インフォマティカ固有: 影響分析は優れたツールです。多くの緊急修正を回避し、SLA を維持するのに役立ちます。私にとって、SLA の改善は柔軟性よりも優れています。Informatica の監視機能も非常に役立ちます。

一般に、会社が単一の ETL ツールに移行している場合、そのジョブを変換すると保守が容易になります。また、サポート チームが 1 つのツールを監視する方が効率的で信頼性が高くなります。あなたの会社がオブジェクトを再利用可能にしようとすることを願っています。これにより、変換が容易になり、将来の生産性が向上します (変換中に作成される新しい再利用可能なオブジェクト)。

注意点: 変換タスクは、実際には見積もることが困難です。可能であれば、これを独立したプロジェクトにしてください (より大きな成果物の一部ではありません)。

于 2010-02-26T17:48:59.057 に答える
1

コーディングにより、優れた柔軟性が得られます。Perl、Python、C#、Java、SQL など、何でも構いません。一部のデータ変換をすばやく簡単に構築できます。わざわざ ETL ソフトウェアを見ようとする人がいるでしょうか?

ソリューション全体の準備が整ったとしましょう。選択した言語のすべてのスクリプトがそこにあります。ここでいくつか質問があります:

  • データ量が増大し、すべてをメモリに収めることができない場合、キャッシュはどこに作成されますか? コントロールできますか?
  • すべてのログをどのように作成しますか? あなたはそれを作成しましたか?
  • エラー処理についてはどうですか?エラー (ディスク容量の問題、接続の問題など) が発生した場合、根本原因は簡単に示されますか?
  • モニタリングはどのように行うのですか?動的ダッシュボードはありますか?
  • あなたのソリューションでクラスタリングは可能ですか?
  • データ変換を複数のスレッドで実行して、実行を高速化することはできますか?
  • フェイルオーバー: 失敗をどのように処理しますか? 失敗した時点からジョブを再開することは可能ですか?
  • コネクティビティ: 新しいデータ ソース (Salesforce など) が表示されます。スクリプトを読み書きできるようにするには、どのくらいの時間が必要ですか?
  • SAP などの ERP システムに接続できますか?
  • スクリプトからデータ系統と影響分析を取得できますか?

これらすべて (さらにはそれ以上) は、派生 ETL ソフトウェアを使用すると得られます。誰かが一生懸命働いて、何年もの間、これらすべての問題に対処し、そのための GUI を入手してきました。それが違いです。

現在: 1 つのファイルをたまに DB にロードする必要がある場合は、何でも構いません。しかし、それらをたくさん持つことを計画している場合は、ETL ソフトウェアを検討する価値があります。また、インフォマティカがすでに社内に存在しているのであれば、わざわざ一からやり直す必要はありません。

于 2016-09-16T13:40:04.000 に答える
1

Informatica のような ETL ツールは、コーディングできない人がいる場合、生産性 (および美しい画像) をもたらします。コードを保守できる人がいなければ意味がありません。コーディングできる人にとっては、モグラ塚を動かすために 500 ポンドのゴリラを雇うようなものです。

参照:この投稿このスレッドこの投稿

自動ジョブ ロギング (何をログに記録するかを考える必要はありません... ほとんどすべてが自動的に行われます) と実行時監視ツール (ワークフローがどこまで進んでいるか、どこにあるのか) には便利です。失敗した?)

于 2009-07-29T21:34:01.590 に答える