java - データベースと通信する Java スクリプトをマルチスレッド化するにはどうすればよいですか

Question

これが私のスクリプトの機能です：

2,700 万行のドキュメントを 1 行ずつ解析します。各行を取得して解析し、必要な情報をデータベーステーブルに挿入します (JDBC を使用)。

問題は、 prepareStatement.executeUpdate() メソッドが非同期ではないため、返されるまで待機することです。これが私のボトルネックです。2700万行を解析するのに約2日かかります:(

JDBC は非同期をサポートしていないため、それぞれの executeUpdate() 呼び出しをスレッドでラップしたいと考えています。毎回新しいスレッドを作成する必要がありますか? または、スレッドプールを使用する必要がありますか?また、そのスレッドプールを作成するにはどうすればよいですか?

行の解析にはほとんど時間がかからないため、スレッドプールで待機しているアクティブなタスクの数が使用可能なスレッドの数を上回り、オープンを待機しているタスクがボトルネックとなり、線形に戻るのではないかと心配しています。スレッド。

ありがとう

score 2 · Accepted Answer

固定数のスレッドで Executor を作成します (最高のパフォーマンスが得られるものは何でも)
最大サイズ、たとえば 100 で BlockingQueue を作成します
必要な数のワーカーを Executor に送信します。それぞれが BlockingQueue への参照と独自の Connection/PreparedStatement を持っています
メインスレッドはput()BlockingQueue のファイルと行を解析します
ワーカーtake()は BlockingQueue から行をスレッド化し、データベースを更新します

(これは基本的なプロデューサー/コンシューマーマルチスレッドシナリオです)

1 に答える 1