numpy が blas とリンクできることを再確認し、gpu アクセラレーション blas ライブラリを使用しない理由を考えました。
誰かがそうしていましたか?
更新 (2014-05-22)
AMD は、clMath を内部的に使用して FFT および BLAS 関数を GPU にオフロードできる AMD Core Math Library (ACML) バージョン 6.0 のベータ リリースを作成しました。発表はこちら: ACML Beta 6.0 Release Leverages the Power of Heterogeneous Compute . ここでの注意点は、 BLAS または FFT 呼び出しごとに、入力データを CPU から GPU に転送し、出力データを CPU に返す必要があることです。そのため、AMD には、ACML が CPU の代わりに GPU を使用するほど大きな問題が発生した場合の調整用のスクリプトが多数用意されています。
完全を期すために、Nvidia はその nvBLAS ライブラリで同様の機能をサポートしていることにも言及しますが、それは cuBLAS と CUDA に依存しているため、Nvidia GPU 以外では動作しません。
元の答え
残念ながら、AMD の GPU アクセラレーション BLAS ライブラリは、標準の CPU ベースの BLAS ライブラリを期待する Numpy やその他のアプリケーションに直接リンクすることはできません。その理由は、既存の GPU BLAS ライブラリはすべて、BLAS 関数を呼び出す前に行列をまず GPU にコピーする必要があるためです。これには、誰かがこのコピーを行うために Numpy を変更する必要があります。
編集: Clyther は、Numpy の機能の一部を置き換えて、すべてを OpenCL に変換できるようです。ここを参照してください: http://srossross.github.io/Clyther/for_numpy_users.html
メモリサーバーの場合、少なくともpyCuda、おそらくpyOpenCLもnumPyで動作します