python - Linuxでタスクセットを使用するマルチコアシステムでのPythonグローバルインタープリターロック(GIL)の回避策?

Question

それで、Python Global Interpreter Lock (GIL) http://blip.tv/file/2232410でこの講演を見終わったところです。

その要点は、GIL がシングルコアシステムにとって非常に優れた設計であるということです (Python は基本的に、スレッドの処理/スケジューリングをオペレーティングシステムに任せています)。しかし、これはマルチコアシステムでは深刻な裏目に出る可能性があり、IO 集中型スレッドが CPU 集中型スレッドによって大幅にブロックされ、コンテキスト切り替えの費用がかかり、ctrl-C の問題 [*] などが発生する可能性があります。

したがって、GIL は基本的に 1 つの CPU で Python プログラムを実行するように制限しているため、これを受け入れて Linux でタスクセットを使用して、プログラムのアフィニティをシステムの特定のコア/CPU に設定しないでください (特に、マルチコアシステムで実行されている複数の Python アプリなど)?

最終的に私の質問は次のとおりです。PythonアプリケーションでLinuxでタスクセットを使用しようとした人はいますか（特に、Linuxシステムで複数のアプリケーションを実行して、特定のコアにバインドされた1つまたは2つのPythonアプリケーションで複数のコアを使用できるようにする場合）。結果でしたか？やる価値はありますか？特定のワークロードで事態が悪化することはありますか? 私はこれを実行してテストする予定です (基本的に、プログラムの実行にかかる時間が長いか短いかを確認します) が、あなたの経験について他の人から聞きたいです.

追加: David Beazley (リンクされたビデオで講演を行っている人物) は、一部の C/C++ 拡張機能が GIL ロックを手動で解放し、これらの拡張機能がマルチコア (つまり、科学的または数値データ分析など) 用に最適化されている場合、数を計算するためのマルチコアの利点を得るのではなく、拡張機能は単一のコアに制限されているという点で効果的に機能しなくなります (したがって、プログラムが大幅に遅くなる可能性があります)。一方、このような拡張機能を使用していない場合

マルチプロセッシングモジュールを使用しない理由は、(この場合) プログラムの一部がネットワーク I/O バウンド (HTTP 要求) に大きく依存しているためです。スレッドが HTTP リクエストを開始し、I/O を待機しているため、GIL を放棄し、別のスレッドがそれを実行できるため、プログラムの一部は、CPU に大きな負担をかけずに 100 以上のスレッドを簡単に実行でき、実際に使用できるようになります。利用可能なネットワーク帯域幅。スタックレス Python/etc に関しては、プログラムを書き直したり、Python スタックを置き換えたりすることにあまり関心がありません (可用性も懸念事項です)。

[*] シグナルを受信できるのはメインスレッドだけなので、ctrl-C を送信すると、Python インタープリターは基本的にシグナルを処理できるようにメインスレッドを実行させようとしますが、どのスレッドを実行するかを直接制御しないため (これはオペレーティングシステムに任されています) 基本的に、最終的にメインスレッドに到達するまでスレッドを切り替え続けるように OS に指示します (運が悪い場合は、しばらく時間がかかる場合があります)。

score 10 · Accepted Answer

別の解決策は次のとおりです。 http://docs.python.org/library/multiprocessing.html

注 1: これはPython 言語の制限ではなく、CPython 実装の制限です。

注 2: アフィニティに関しては、OS 自体で問題が発生することはありません。

score 3 · Accepted Answer

興味深い解決策は、Ryan Kelly が彼のブログで報告した実験です: http://www.rfk.id.au/blog/entry/a-gil-adventure-threading2/

結果は非常に満足のいくようです。

score 1 · Accepted Answer

GIL が Python から削除されるまでは、スレッドの代わりにコルーチンを使用できます。この戦略は、少なくとも 1 つのケースで greenlet を使用して成功した 2 つのスタートアップ企業によって実装されたという正当な権限があります。

score 1 · Accepted Answer

何年にもわたって、次の経験則で十分であることがわかりました。ワーカーが何らかの共有状態に依存している場合、コアごとに 1 つのマルチプロセッシングプロセス (CPU バウンド) を使用し、コアごとにワーカースレッドの修正プール (I/O バウンド) を使用します。）。OS は、さまざまな Python プロセスをコアに割り当てます。

score 1 · Accepted Answer

Python GIL は Python インタープリターごとです。つまり、マルチプロセッシング中に問題を回避するには、単純に複数のインタープリターを起動し (つまり、同時実行のためにスレッドではなく個別のプロセスを使用する)、プロセス間の通信に他の IPC プリミティブ (ソケットなど) を使用する必要があります。そうは言っても、I/O 呼び出しをブロックするスレッドを使用する場合、GIL は問題になりません。

前述の GIL の主な問題は、2 つの異なる Python コードスレッドを同時に実行できないことです。ブロッキング I/O 呼び出しでブロックしているスレッドがブロックされるため、Python コードが実行されません。これは、GIL をブロックしていないことを意味します。別々の Python スレッドに 2 つの CPU 集中型タスクがある場合、GIL が Python のマルチプロセッシングを強制終了する場所です (以前に指摘したように、CPython 実装のみ)。CPU #0 が他の Python スレッドの実行でビジー状態である間に、GIL が CPU #1 による Python スレッドの実行を停止するためです。

score 1 · Accepted Answer

これはかなり古い質問ですが、マルチコアシステムでの Python とパフォーマンスに関する情報を検索するたびに、この投稿が常に結果リストに表示されるため、この過去を私の考えを共有しないようにすることはできません。

マルチプロセッシングモジュールを使用すると、タスクごとにスレッドを作成するのではなく、コードを解釈する cpython コンパイラの別のプロセスを作成できます。アプリケーションがマルチコアシステムを利用できるようになります。このアプローチで私が目にする唯一の問題は、メモリ上に新しいプロセススタック全体を作成することで、かなりのオーバーヘッドが発生することです。( http://en.wikipedia.org/wiki/Thread_(computing)#How_threads_differ_from_processes )

Python マルチプロセッシングモジュール: http://docs.python.org/dev/library/multiprocessing.html

「マルチプロセッシングモジュールを使用しない理由は、(この場合) プログラムの一部がネットワーク I/O バウンド (HTTP 要求) に大きく依存しているためです。そのため、ワーカースレッドのプールを持つことは、箱から出してすぐにパフォーマンスを引き出すための優れた方法です。 ...」

これについては、プロセスのプールも持つことができると思います: http://docs.python.org/dev/library/multiprocessing.html#using-a-pool-of-workers

アット、レオ

python - Linuxでタスクセットを使用するマルチコアシステムでのPythonグローバルインタープリターロック(GIL)の回避策?

7 に答える 7

Related

Reference