3

multiprocessing.pool.map()によって呼び出される関数で番号を順番にインクリメントしようとしています。次のコードを実行すると、各番号のプールと同じ回数だけ番号がインクリメントされます。

import time
import multiprocessing
import decimal
import random

lists = ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h','i', 'j', 'k']
def thefunction(listi):
    global number
    number += 1
    time.sleep(decimal.Decimal(random.random()))
    print time.strftime('%H:%M:%S'), number, listi

number = 0
pool = multiprocessing.Pool(4)
pool.map(thefunction, lists)
print number

結果は次のように出力されます

01:01:28 1 b
01:01:28 2 e
01:01:28 1 a
01:01:28 1 c
01:01:28 1 d
01:01:28 2 h
01:01:29 2 i
01:01:29 2 g
01:01:29 3 f
01:01:29 3 j
01:01:29 3 k
0

どうすれば正しく番号を増やすことができますか?

(time.sleep(decimal.Decimal(random.random()))は、同じ行へのスクリプトの印刷を停止するためにのみ追加されました)

4

2 に答える 2

4

この例が機能しない理由は、カウンターのいくつかのインスタンスが個別に作成およびインクリメントされているためです。

開始されるプロセスごとに適切に初期化される共有カウンターとロックを作成する必要があります。

import time
from multiprocessing import Pool, Value, Lock
import decimal
import random

number = Value('i', 0)
lock = Lock()
lists = ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h','i', 'j', 'k']

def thefunction(listi):
    time.sleep(decimal.Decimal(random.random()))
    with lock:
        number.value += 1
        print time.strftime('%H:%M:%S'), number.value, listi

def initializer(*args):
    global number, lock
    number, lock = args

pool = Pool(4, initializer, (number, lock))
pool.map(thefunction, lists)
print number.value
于 2012-08-25T01:26:29.563 に答える
2

おそらくmultiprocessing.Value、共有状態のを必要とします。

むしろ、それはあなたが求めることをするでしょうが、それはあなたが本当に望んでいることではないかもしれません; 並列コンテキストでの共有状態は、通常、設計上の欠陥の兆候です。代わりにできることの1つは、各プロセスに処理したアイテムの数を追跡させ、そのカウントを親に返すことです。次に、親は、それぞれが完了したジョブの数を合計して、この時点までに実行された作業の量を分類できます。

プロセスの境界を越えてカウントしようとしている理由は何ですか?

于 2012-08-25T00:38:06.903 に答える