python - 最初の呼び出しで pycuda.gpuarray.dot() が非常に遅い

翻译自：https://stackoverflow.com/questions/17574547 2013-07-10T15:19:49.713

734 次

私は最適化したいpycudaで共役勾配法の実装を行っています。自己記述の行列ベクトル乗算と pycuda-nativegpuarray.dotおよびgpuarray.mul_add関数を使用します

1 回の呼び出しkernprof.py/line_profilerで収束するまでのほとんどの時間 (>60%)が返されたプログラムのプロファイリング。gpuarray.dot()(約 0.2 秒) 以降のすべての呼び出しにはgpuarray.dot()、約 7 マイクロ秒かかります。すべての呼び出しは同じタイプの入力ベクトルを持ちます (サイズ: 400 double)

何か理由はありますか？最終的には単なる定数ですが、プロファイリングが難しくなっています。pycudaメーリングリストで質問したかったのです。しかし、@gmail.com のアドレスで登録できませんでした。誰かが奇妙な.dot()動作の説明を持っている場合、またはそのメーリングリストに登録できない場合は、ヒントを教えてください ;)

python - 最初の呼び出しで pycuda.gpuarray.dot() が非常に遅い

1 に答える 1

Related

Reference