Python プログラムの奇妙な動作に遭遇しました。基本的に、1000 を超える長さの SumTree を作成して埋めようとすると、ディスク使用量が 300MB/s まで大幅に増加し、プログラムが停止しました。
このプロセスにファイルの読み取り/書き込みが含まれていないと確信しており、問題はadd
関数にあります。コードを以下に示します。
import numpy as np
class SumTree():
trans_idx = 0
def __init__(self, capacity):
self.num_samples = 0
self.capacity = capacity
self.tree = np.zeros(2 * capacity - 1)
self.transitions = np.empty(self.capacity, dtype=object)
def add(self, p, experience):
tree_idx = self.trans_idx + self.capacity - 1
self.transitions[self.trans_idx] = experience
self.transitions.append(experience)
self.update(tree_idx, p)
self.trans_idx += 1
if self.trans_idx >= self.capacity:
self.trans_idx = 0
self.num_samples = min(self.num_samples + 1, self.capacity)
def update(self, tree_idx, p):
diff = p - self.tree[tree_idx]
self.tree[tree_idx] = p
while tree_idx != 0:
tree_idx = (tree_idx - 1) // 2
self.tree[tree_idx] += diff
def get_leaf(self, value):
parent_idx = 0
while True:
childleft_idx = 2 * parent_idx + 1
childright_idx = childleft_idx + 1
if childleft_idx >= len(self.tree):
leaf_idx = parent_idx
break
else:
if value <= self.tree[childleft_idx]:
parent_idx = childleft_idx
else:
value -= self.tree[childleft_idx]
parent_idx = childright_idx
data_idx = leaf_idx - self.capacity + 1
return leaf_idx, self.tree[leaf_idx], self.transitions[data_idx]
@property
def total_p(self):
return self.tree[0] # the root
@property
def volume(self):
return self.num_samples # number of transistions stored
この SumTree オブジェクトが使用される例を次に示します。
def add(self, experience)
max_p = np.max(self.tree.tree[-self.tree.capacity:])
if max_p == 0:
max_p = 1.0
exp = self.Experience(*experience)
self.tree.add(max_p, exp)
whereExperience
は名前付きタプルでself.tree
、Sumtree インスタンスです。最後の行を削除すると、高いディスク使用率がなくなります。
誰でもこれで私を助けることができますか?