database - Java アプリケーションでの一括データインポート

Question

私は.csvファイルからデータベースに膨大な量のデータをインポートするJavaプロジェクトに取り組んでいます。これを達成するための最良のアプローチを理解することに興味があります。

スペクトルの反対側からの考えを教えてください。

score 0 · Accepted Answer

最適なオプションは、巨大なデータで一括操作を行う際に、DB のネイティブサポートを使用することです。Oracle の場合はSQL*Loaderです。Postgres の場合、COPYコマンドがあります。

Java 固有のオプションを探している場合は、以下が私の優先順位です。

JDBC:バッチ操作のサポートを使用しますが、バッチ操作で障害が発生するとフロー全体がショートするという制限があります
Hibernate: ORM はこのためのものではありません。ただし、StatelessSessionとバッチ構成を一緒に使用して、最適なパフォーマンスを実現できます。

score 0 · Accepted Answer

私の意見では、そのようなケース (一括インポート) は、データベース機能を使用して対処する必要があります。

Oracle SQLLoader の場合 (@Pangea の提案による)

MS SQL Server BCP（一括コピー）の場合

これに対する@Javaベースのアプローチを探している場合は、@Pangeaをエコーしますそれに加えて、バッチ挿入をサブバッチに分割し、それらを同時に実行してパフォーマンスを向上させることができます。

例: 挿入するレコードが 10,000 の場合、それぞれ 200 レコードのバッチを作成し、5 つのバッチを同時に挿入できます。

この場合、各サブバッチを追跡するコードが必要です。

お役に立てれば！

database - Java アプリケーションでの一括データ インポート