python - Anaconda Accelerate 内積は、プレーンな NumPy よりも 2 倍遅い

Question

Anaconda Accelerate が Python 3 でプレーンな NumPy よりも内積を計算するのが遅いのはなぜですか? 私は、accelerator_cudalib 2.0 がインストールされたバージョン 2.3.1 の加速、Python 3.5.2 Windows 10 64 ビットを使用しています。

import numpy as np
from accelerate.cuda.blas import dot as gpu_dot
import time

def numpydot():
    start= time.time()
    for i in range(100):
        np.dot(np.arange(1000000, dtype=np.float64), np.arange(1000000, dtype=np.float64))
    elapsedtime = time.time()-start
    return elapsedtime

def acceleratedot():
    start= time.time()
    for i in range(100):
        gpu_dot(np.arange(1000000, dtype=np.float64), np.arange(1000000, dtype=np.float64))
    elapsedtime = time.time()-start
    return elapsedtime


numpydot()
0.6446375846862793
acceleratedot()
1.33168363571167

score 0 · Accepted Answer

共有配列は、別のライブラリである Numba で作成されることがわかりました。彼らのサイトにドキュメントがあります。

python - Anaconda Accelerate 内積は、プレーンな NumPy よりも 2 倍遅い

1 に答える 1

Related

Reference