multithreading - TPLキューの管理

Question

さまざまなサーバーのスキャンを実行するサービスがあります。問題のネットワークは巨大になる可能性があります（数十万のネットワークノード）。

ソフトウェアの現在のバージョンは、私たちが設計したキューイング/スレッドアーキテクチャを使用していますが、これは機能しますが、効率的ではありません（特に、ジョブが適切に処理されない子を生成する可能性があるため）

V2が登場し、TPLの使用を検討しています。理想的には適しているようです。

私はこの質問を見てきました。その答えは、TPLが処理できるタスクに制限がないことを意味します。私の簡単なテスト（100,000個のタスクをスピンアップしてTPLに渡す）では、TPLはかなり早い段階でメモリ不足の例外を除いてバーフしました（十分に公平です-特に私の開発ボックスで）。

スキャンにはさまざまな時間がかかりますが、5分/タスクが適切な平均です。

ご想像のとおり、巨大なネットワークのスキャンは、強力なサーバーであっても、かなりの時間がかかる可能性があります。

スキャンジョブ（Dbに格納されている）を複数のスキャンサーバー間で分割できるフレームワークはすでに用意されていますが、問題は、特定のサーバーのTPLに作業をどの程度正確に渡す必要があるかです。

TPLのキューのサイズを監視し、それが数百エントリを下回った場合に（たとえば）それを補充できますか？これを行うことの欠点はありますか？

また、スキャンを一時停止する必要がある状況にも対処する必要があります。これは、すでに部分的に処理されている可能性のあるタスクをキャンセル/リセットするよりも、TPLに作業を渡さない方が簡単なようです。

すべての初期タスクは、任意の順序で実行できます。親が実行を開始した後に子を実行する必要がありますが、親が子を生成するため、これが問題になることはありません。子供は任意の順序で実行できます。このため、現在、子タスクはTPLに直接生成されるのではなく、Dbに書き戻されることを想定しています。これにより、必要に応じて他のサーバーが「盗む」ことができます。

誰かがこのようにTPLを使用した経験がありますか？知っておく必要のある考慮事項はありますか？

score 11 · Accepted Answer

TPLとは、小さな作業単位を開始し、それらを並行して実行することです。これは、この作業を監視、一時停止、または調整することではありません。

TPLは、「作業」を開始し、スレッドを同期するための低レベルのツールと見なす必要があります。

キーポイント：TPLタスク！=論理タスク。論理タスクは、スキャンタスク（「xからyまでのIP範囲をスキャンする」）の場合です。このようなタスクは、物理タスク「System.Threading.Task」に対応するべきではありません。これは、2つが異なる概念であるためです。

TPLは論理タスクを理解しておらず、実行できないため、論理タスクを自分でスケジュール、オーケストレーション、監視、および一時停止する必要があります。

今、より実際的な懸念：

TPLは確かにOOMなしで100kのタスクを開始できます。タスクのコードがメモリを使い果たしたため、OOMが発生しました。
ネットワークのスキャンは、非同期コードの優れたケースのように聞こえます。スキャンしている間は、高度な並列処理を行いながら結果を待つ可能性が高いためです。おそらく、ネットワークパケットが到着するのをすべて待機しているプロセスに500のスレッドを持たせたくないでしょう。非同期タスクは、実行するすべてのタスクが純粋にCPUにバインドされて小さくなるため、TPLにうまく適合します。それがTPLのスイートスポットです。

multithreading - TPLキューの管理

1 に答える 1

Related

Reference