3

「ETL ツール」という用語が最近よく使われていると聞き、それらについて詳しく知るために掘り下げ始めました。ここでJava用のオープンソースETLツールの素晴らしいリストを見つけて、それらを読み始めました。

しかし、それは私を本当に混乱させました。

これらのツール (CloverETL、Pentaho など) のほとんどは GUI ツールです。それらの一部 (Smooks など) は純粋な Java フレームワークです。これは理にかなっていると思います。一部の ETL ユーザーは、技術に詳しくない場合や、GUI ツールを使用して変換をセットアップしたい場合があります。他のユーザーは、これらのツールの生の ETL パワーを利用したい開発者です。

私の質問: これらの GUI ツールが純粋な Java フレームワークよりも優れている点 (追加機能など) はありますか、またはその逆はありますか? CloverETL や Pentaho などの「メジャー プレイヤー」GUI ツール (GUI ツールと自称している) にも、同じことを (プログラムで) 達成できる Java API がありますか? それとも純粋な GUI ツールですか? Java Docs がどこにも見つかりません (どちらの場合も)。

4

1 に答える 1

3

いいえ、ETL に GUI 以外のツールを使用するメリットはまったくありません。

ほとんどの典型的な状況では、ETL ジョブには GUI アプローチの方がはるかに効率的です。これは、ツールを使用すると、カスタム コードをほとんど記述せずにデータ タスクを迅速に実行できる方法が提供されるためです。これは、ETL プラットフォームが哲学上、コード生成プラットフォームにすぎないためです。キャンバスに描かれたタスクは、ツール エンジンによって (理想的には最も適切な方法で) マシン コードに変換され、中間エージェントなしで内部で直接実行されます。 . より大きなものは、複雑なクライアント サーバー アーキテクチャを持っていますが、基本的な考え方は変わりません。

この生成されたコードがどの程度隠されているかは、プラットフォームによって異なります。Pentaho や Datastage のように、実際にユーザーがアクセスできないようにするものもあります。その他、Talend (アプリケーションへの組み込みや直接実行が容易なクラスで Java コードを生成する) や SAS Data Integration Studio (.sas ファイルを生成する) などは、開発者が生成されたコードを掘り下げる可能性を提供します。しかし、それは常に筋金入りの開発者に残された選択肢であり、通常のユーザーが日常の仕事をするためにコードの内部に入ることはほとんどありません。

于 2012-12-19T00:08:33.570 に答える