5

500 個の入力ファイルを含むフォルダーがあります (すべてのファイルの合計サイズは ~ 500[MB])。

python次のことを行うスクリプトを書きたいと思います。

(1)すべての入力ファイルをメモリにロードする

(2)python後で使用される空のリストを初期化します...箇条書き(4)を参照してください

(3) 15 の異なる (独立した) プロセスを開始します。これらのそれぞれは [からの(1)] 同じ入力データを使用しますが、異なるアルゴリズムを使用して処理するため、異なる結果が生成されます。

(4)すべての独立したプロセス [ステップ から] の出力を同じリスト [ステップ で初期化されたのと同じリスト](3)に保存したいpython(2)

15 のプロセスすべての実行が完了するとone python list、15 の独立したプロセスすべての結果が含まれます。

私の質問は、上記を効率的に行うことは可能pythonですか? もしそうなら、その方法を説明するスキーム/サンプルコードを提供できますか?

注 #1:強力なマルチコア サーバーでこれを実行します。したがって、ここでの目標は、すべての独立したプロセス間で一部のメモリ { input data, }を共有しながら、すべての処理能力を使用することです。output list

注 #2:私はあるLinux環境で作業しています

4

1 に答える 1