1

いくつかの計算を高速化するために、Linux Mint 17.2 に openBLAS をインストールしたいと考えていました。このチュートリアル[1]に従い、openBLAS と numpy を正常にインストールしました (1.9.3 バージョンを使用しました)。テストプログラムを実行したところ、次の結果が得られました。

dotted two (1000,1000) matrices in 167.9 ms
dotted two (4000) vectors in 6.85 us
SVD of (2000,1000) matrix in 2.860 s
Eigendecomp of (1500,1500) matrix in 26.969 s 

実際、numpy を削除して sudo apt-get install python-numpy でシステム numpy をインストールすると、次の結果が得られました。

dotted two (1000,1000) matrices in 255.2 ms
dotted two (4000) vectors in 5.77 us
SVD of (2000,1000) matrix in 3.476 s
Eigendecomp of (1500,1500) matrix in 13.271 s

openblas ルーチンは、ネイティブの blas や lapack よりも遅いようです。何が間違っている可能性がありますか?

これは numpy.show_config() の出力です:

lapack_opt_info:
    libraries = ['openblas']
    library_dirs = ['/opt/openblas/lib']
    language = f77
blas_opt_info:
    libraries = ['openblas']
    library_dirs = ['/opt/openblas/lib']
    language = f77
openblas_info:
    libraries = ['openblas']
    library_dirs = ['/opt/openblas/lib']
    language = f77
openblas_lapack_info:
    libraries = ['openblas']
    library_dirs = ['/opt/openblas/lib']
    language = f77
blas_mkl_info:
  NOT AVAILABLE

私のプロセッサには、コアごとに 2 つのスレッドを持つ 4 つの CPU があります。テスト例を実行したときに 5 ~ 6 個のスレッドが存在することを htop で確認しました。

4

0 に答える 0