1

これは私の行列因数分解コードの一部です (nmf の非常に奇妙なバージョン)。私の問題は、反復するたびに W と H マトリックスの古いコピーを保存しますが、W が毎回更新を終了した後に old_W と W を比較すると、実際には同じです! したがって、実際のエラー出力は常に 0 であり、while ループは最初の反復後に停止します。ただし、「#print old - new」は、要素 W[r][i] が実際には毎回更新されていることを示しています。私が見ていないのは何ですか?

def csmf(V, l, max_iter, err, alpha=0.01, beta=0.01, lamb=0.01):
  W = np.random.rand(V.shape[0], l)
  H = np.random.rand(l, V.shape[1])
  n = V.shape[0]
  N = V.shape[1]

  NwOone = 60
  NwOtwo = 60
  NhOone = 50
  NhOtwo = 50

  for t in range(max_iter):
    old_W = W # save old values
    old_H = H
    old = criterion(V,old_W,old_H,l,alpha,beta,lamb)
    print "iteration ", t

    ##### update W
    print "updating W"
    setw = range(0,n)
    subset_one = random.sample(setw,NwOone)
    subset_two = calcGw(V, W, H, n, l, alpha, beta, NwOtwo)
    chosen = np.intersect1d(subset_one,subset_two)

    for r in chosen:
      for i in range(len(W[0])):
        update = wPosNeg(W[r],N,i,l,V,r,beta,H)
        old = W[r][i]
        W[r][i] = update
        new = W[r][i]
        #print old - new

    ##### update H
    print "updating H"
    seth = range(0,N)
    subset_oneh = random.sample(seth,NhOone)
    subset_twoh = calcGh(V, W, H, N, l, NhOtwo,lamb)
    chosenh = np.intersect1d(subset_oneh,subset_twoh)

    for s in chosenh: # column
      for i in range(len(H)):
        updateh = hPosNeg(H[i],n,i,l,V,s,lamb,W)
        H[i][s] = updateh

    ##### check err
    print "Checking criterion"
    print criterion(V,W,H,l,alpha,beta,lamb)
    print criterion(V,old_W,old_H,l,alpha,beta,lamb)
    actual = abs(criterion(V,W,H,l,alpha,beta,lamb)  -criterion(V,old_W,old_H,l,alpha,beta,lamb))
    if actual <= err: return W, H, actual
  return W, H, actual

dmat = np.random.rand(100,80)
W, H, err = csmf(dmat, 1, 10, 0.001, alpha=0.001, beta=0.001, lamb=0.001)
print err
4

1 に答える 1

0

これらの行で old_W = W # save old values old_H = H は、コピーを保存しているのではなく、参照を保持しています (old_W と W は同じメモリの一部です)。

これを試して: old_W = W.copy() # save old values old_H = H.copy()

于 2016-04-05T17:31:57.433 に答える