ETLツールとして使用されるSpringBatchについて、誰かが情報を共有できる場合。特に、ネットワークスイッチからの通話データレコードの読み込み(CDR)のためのテレコム企業で。社内ETLはSpringBatchを使用して開発されました。
本番環境でのパフォーマンスは?
スケーラビリティを実現するためにSpringBatchで使用されるクラウドコンピューティングプラットフォーム。
ETLツールとして使用されるSpringBatchについて、誰かが情報を共有できる場合。特に、ネットワークスイッチからの通話データレコードの読み込み(CDR)のためのテレコム企業で。社内ETLはSpringBatchを使用して開発されました。
本番環境でのパフォーマンスは?
スケーラビリティを実現するためにSpringBatchで使用されるクラウドコンピューティングプラットフォーム。
SpringBatch は、Java 開発者が ETL ジョブを作成するのに非常に単純であり、SSIS のような専用の ETL ツールよりも単純で保守しやすい可能性があります。
私が実行している大規模なジョブはすべて、アプリ自体ではなくネットワーク遅延によって制約されるため、パフォーマンスに関する詳細な情報を提供することはできませんが、小規模な抽出タイプのジョブ (最大 10K レコード) は通常 3 ~ 5 秒で実行されます。そのほとんどは、構成のロードと読み取りです。
また、フレームワークで提供されるものは通常スレッドセーフではないため、独自のリーダー クラスとライター クラスをいくつか作成する必要がありますが、マルチスレッドで使用するように簡単に構成することもできます。
具体的なご質問がございましたら、喜んでお答えいたします。