python - Pythonで複数のプロセッサを利用した共有データ

Question

重い辞書をデータ (約 250M データ) として使用する CPU 集中型のコードがあります。マルチコアプロセッサを使用していて、一度に複数のタスクを実行できるように利用したいと考えています。ディクショナリはほとんどが読み取り専用で、1 日に 1 回更新される場合があります。
辞書を複製せずにPythonでこれを書くにはどうすればよいですか?
Python スレッドはネイティブスレッドを使用せず、真の同時実行性を提供しないことを理解しています。プロセス間でデータをシリアル化せずにマルチプロセッシングモジュールを使用できますか?

私はJavaの世界から来ました。私の要件は、データを共有し、複数のプロセッサで実行し、同期プリミティブを提供できるJavaスレッドのようなものです。

score 1 · Accepted Answer

プロセス間で読み取り専用データを単純に共有できますfork(Unix では、Windows では簡単な方法ではありません)。独自のコピーを更新するプロセス)。のようなネイティブの Python 構造dictは、共有メモリ内の任意のアドレスに存在するように設計されていないため ( dictC でそれをサポートするバリアントをコーディングする必要があります)、慰めにはなりません。

Jython (または IronPython) を使用して、複数の同時スレッドによるマルチプロセッサの使用を含め、Java (またはそれぞれ C#) とまったく同じマルチスレッド機能を備えた Python 実装を取得できます。

score 1 · Accepted Answer

shelve辞書に使用します。書き込みは頻繁に行われないため、共有しても問題はありません。

score 0 · Accepted Answer

stdlib でこれを見てみましょう: http://docs.python.org/library/multiprocessing.html プロセス間でデータ構造を非常に簡単に共有できる素晴らしい機能がたくさんあります。

python - Pythonで複数のプロセッサを利用した共有データ

3 に答える 3

Related

Reference