Python アルゴリズムを Cython に実装して最適化しようとしています。私の質問は、次のコードに存在する特定のパフォーマンスのボトルネックに関するものです。
@cython.boundscheck(False) # turn off bounds-checking for entire function
def anglesToRGB( np.ndarray[double, ndim=2] y, np.ndarray[double, ndim=2] x ):
cdef double angle
cdef double Hp
cdef double C
cdef double X
cdef np.ndarray[double, ndim=3] res = np.zeros([y.shape[0], y.shape[1], 3], dtype=np.float64)
for i in xrange(y.shape[0]):
for j in xrange(y.shape[1]):
angle = atan2( y[i,j], x[i,j] )*180.0/PI+180
C = sqrt(pow(y[i,j],2)+pow(x[i,j],2))/360.0 #Chroma
Hp = angle/60.0
X = C*(1-fabs( Hp%2-1))
C *= 255
X *= 255
if (0. <= Hp < 1.):
res[i,j,:] = [C,X,0]
elif (1. <= Hp < 2.):
res[i,j,:] = [X,C,0]
elif (2. <= Hp < 3.):
res[i,j,:] = [0,C,X]
elif (3. <= Hp < 4.):
res[i,j,:] = [0,X,C]
elif (4. <= Hp < 5.):
res[i,j,:] = [X,C,C]
else:
res[i,j,:] = [C,0,X]
return res
次のように、値のリストを res 配列のスライスに割り当てるときに、主要なボトルネックを特定しました。
res[i,j,:] = [C,X,0]
ただし、割り当てを変更すると
res[i,j,0] = C
res[i,j,1] = X
res[i,j,2] = 0
その後、コードは桁違いに速く実行されます。確かにCythonコンパイラは私のためにこれを行うのに十分スマートでなければならないので、私にとってこれは奇妙です? それとも、最初にいくつかのヒントを提供する必要がありますか? スライスを : ではなく 0:3 に変更し、値のリストを numpy 配列にしても、パフォーマンスは向上しないことに注意してください。
私が知りたいのは、この操作がパフォーマンスを大幅に低下させる理由と、便利なリストとスライス表記を犠牲にすることなく解決する方法があるかどうかです。
よろしくお願いします