500 個の入力ファイルを含むフォルダーがあります (すべてのファイルの合計サイズは ~ 500[MB])。
python
次のことを行うスクリプトを書きたいと思います。
(1)すべての入力ファイルをメモリにロードする
(2)python
後で使用される空のリストを初期化します...箇条書き(4)を参照してください
(3) 15 の異なる (独立した) プロセスを開始します。これらのそれぞれは [からの(1)
] 同じ入力データを使用しますが、異なるアルゴリズムを使用して処理するため、異なる結果が生成されます。
(4)すべての独立したプロセス [ステップ から] の出力を同じリスト [ステップ で初期化されたのと同じリスト](3)
に保存したいpython
(2)
15 のプロセスすべての実行が完了するとone python list
、15 の独立したプロセスすべての結果が含まれます。
私の質問は、上記を効率的に行うことは可能python
ですか? もしそうなら、その方法を説明するスキーム/サンプルコードを提供できますか?
注 #1:強力なマルチコア サーバーでこれを実行します。したがって、ここでの目標は、すべての独立したプロセス間で一部のメモリ { input data
, }を共有しながら、すべての処理能力を使用することです。output list
注 #2:私はあるLinux
環境で作業しています