Anaconda Accelerate が Python 3 でプレーンな NumPy よりも内積を計算するのが遅いのはなぜですか? 私は、accelerator_cudalib 2.0 がインストールされたバージョン 2.3.1 の加速、Python 3.5.2 Windows 10 64 ビットを使用しています。
import numpy as np
from accelerate.cuda.blas import dot as gpu_dot
import time
def numpydot():
start= time.time()
for i in range(100):
np.dot(np.arange(1000000, dtype=np.float64), np.arange(1000000, dtype=np.float64))
elapsedtime = time.time()-start
return elapsedtime
def acceleratedot():
start= time.time()
for i in range(100):
gpu_dot(np.arange(1000000, dtype=np.float64), np.arange(1000000, dtype=np.float64))
elapsedtime = time.time()-start
return elapsedtime
numpydot()
0.6446375846862793
acceleratedot()
1.33168363571167