java - CompletionService で大量のタスクを処理する

Question

マルチコアマシンで多数の (1 億を超える) 要求を処理する必要があります (各要求はデータファイル内の行を処理するためのものであり、リモートシステムとの I/O を伴います。詳細はあまり重要ではありませんが、、特定のタスクは、いくつかのデータファイルから配布された Hazelcast マップを読み込むことです)。実行はThreadPoolExecutorを通じて処理されます。1 つのスレッドがファイルを読み取り、データを複数の独立したスレッドに送信してマップに配置します。マシンには 32 個のコアがあるため、マップの並列読み込みに十分な空き容量があります。

リクエストの数が多いため、タスクを作成して executor サービスのキューに入れるという一般的な方法は、キューに入れられたタスクが大量のメモリを消費するため、現実的ではありません。

ExecutorCompletionServiceをもたらします。それを使用すると、前の操作が完了したときにタスクが送信されます。これは、呼び出しtake()(またはpoll()、該当する場合) によって認識されます。これは、executor サービスのすべてのスレッドが使用されている場合に正常に機能します。ただし、「すべてのスレッドをロードする」ことはまだ行われていません。次の 2 つのフェーズがあります。

キューをいっぱいにする: プールにまだ未使用のスレッドがある間に、タスクを ExecutorCompletionService に送信し、さらに送信するまで待機しません。
feed the queue : スレッドがすべて使用されたら、前のタスクが終了したときにのみタスクを送信します。したがって、行は可能な限り迅速にフィードされますが、それ以上速くはならず、キューにも入れられません。

上記はコーディングできますが、上記のロジックが既に実装されているかどうか疑問に思っていて、どういうわけか見逃していました。よくあるシナリオだと思うので質問します。

score 4 · Accepted Answer

BlockingQueueを作成するときに実装を指定できますThreadPoolExecutor。回避しようとしているのが余分なRunnableオブジェクトを作成することだけである場合は、境界付きを使用できますBlockingQueue。たとえばArrayBlockingQueue、キューが容量に達している間はブロックされるアイテムをキューにプッシュする単一のスレッドを作成します。

java - CompletionService で大量のタスクを処理する

2 に答える 2

Related

Reference