問題タブ [openblas]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - CPU (theano を blas に直接バインド) は遅いですか?
手順に従いましたhttps://www.kaggle.com/c/otto-group-product-classification-challenge/forums/t/13973/a-few-tips-to-install-theano-on-windows-64 -bits を使用して Windows マシンに theano をインストールし、theano.misc.check_blas.test() を実行して blas の速度をテストすると、約 10 秒で動作します。
ただし、.theanorc.txt ファイルからこれらの行を取り出すと、
結果は次のようになります (最後の出力行のみを示します)。
Theano の blas への直接バインディングは、直接バインディングがない場合よりもはるかに遅いのはなぜですか?? 私が使っていたブラは間違っていますか?
(上記のリンクの手順に従って、openblas - OpenBLAS-v0.2.14-Win64-int32.zip ( http://sourceforge.net/projects/openblas/files/v0.2.14/OpenBLASからダウンロードできます) をダウンロードして使用します。 -v0.2.14-Win64-int32.zip/download )、ローカル C:\\openblas に保存)
以下のスクリプトを使用してテストも行いました。
また、結果 (openblas へのバインド) も NP よりも遅くなります。
macos - Yosemite で openblas に対して numpy をコンパイルしようとしましたが、otool は私のビルドが Apple の Accelerate Framework にリンクされていることを示しています
- OS: ヨセミテ 10.10.5
- virtualenv を使用して、
- .bashrc/.bash_profile/.profile すべて空
- 「make && make PREFIX=/usr/local/opt/openblas install」を使用してopenblasをインストールしました。つまり、/usr/local/opt/openblasにインストールされたことを意味します
- CUDA と CuDNN はすべてインストールされ、テストされています。
cd ~/テスト
ls
export PATH="/opt/local/bin:/opt/local/sbin:/usr/local/Cellar/bin:/usr/local/bin:$PATH"
export PATH="/Developer/NVIDIA/CUDA-7.5/bin:$PATH"
export DYLD_LIBRARY_PATH="/Developer/NVIDIA/CUDA-7.5/lib:$DYLD_LIBRARY_PATH"
export LDFLAGS=-L/usr/local/opt/openblas/lib
export CPPFLAGS=-I/usr/local/opt/openblas/include
私のvirtualenvをアクティブにした後、env1と言います:
(env1)~>cd ~/test/numpy-1.10.4
(env1)numpy-1.10.4>cat site.cfg
(env1)>python setup.py 構成
(env1)numpy-1.10.4>python setup.py build --fcompiler=gnu95
(env1)numpy-1.10.4>python setup.py インストール
(env1)numpy-1.10.4>cd ~
(env1)~>パイソン
(env1)~>otool -L ~/.virtualenvs/env1/lib/python2.7/site-packages/numpy/core/multiarray.so
====================
だから問題は何ですか!!
numpy が openblas ではなく、Apple の Accelerate Framework でビルドされているのはなぜですか?
私が使用する場合:
brew install numpy --with-openblas
すべて問題ありません。numpy.show_config() と otool は、openblas に対してビルドされていることを示しますが、virtualenv で、どの brew install がそれを保証しないかを確認する必要があります。
私はこのhttp://numpy-discussion.10968.n7.nabble.com/OpenBLAS-on-Mac-td36544.htmlを注意深く読んでいました が、まだそれを成し遂げることができません.virtualenvを再作成しようとしましたが、運がありません.
どんな助けでも大歓迎です!
dynamic-linking - プログラムを OpenBLAS と IntelMKL の両方にリンクする
インテル® MKL の blas ライブラリーと OpenBLAS のライブラリーは同じインターフェースを持っているため、プログラムをこれらのライブラリーにリンクする順序が、MKL の関数が呼び出されるか OpenBLAS の関数が呼び出されるかに影響することがわかりました。
実際には、MKL の行列乗算または OpenBLAS の行列乗算のいずれかを選択的に呼び出したいと考えています。
どうやってやるの?
c++ - 非正方行列でのOpenblas cblasセグメンテーション違反
openblas cblas テスト プログラムの実行に問題があります。私の Cblas は、正方行列を乗算するときに完全に実行されますが、非正方行列で試してみると、「セグメンテーション違反 - コア ダンプ」というエラーが表示されます。次元の問題を確認して再確認しましたが、正しいように見えるので、何が問題なのか疑問に思っています。違う。m=300 の代わりに m=200 と入力すると、完全に機能します。
たとえば、次のプログラムは動作しません
事前にどうもありがとう
openblas - OpenBLAS のインストールを求める
OpenBLAS を Mac OS にインストールしようとしましたが、失敗したようです。まず、ソースをダウンロードして解凍し、ターミナルで「make」コマンドを入力します。ただし、その後「make install」を実行できません。
. OpenBLAS のインストールが完了していないようです。私は何をすべきか?ありがとう。
c++ - (C++) OpenBlas ライブラリを C++ で使用するには?
これがすべて単純すぎるように思われる場合は申し訳ありませんが、私は初心者であり、Windows の C++ IDE "CodeBlocks" で OpenBlas ライブラリを使用しようとしています。より具体的には、行列とベクトルの乗算と三重対角行列システム ライブラリの解法を使用したいと考えています。OpenBlas サイトのページの下部にあるファイルをダウンロードしました。私自身のような初心者向けのリソースがオンラインでほとんどまたはまったくないため、どのように開始すればよいかわかりません。どのライブラリを .cpp ファイルのプリアンブルに含める必要があるか、正しいファイル セットをダウンロードしたか、どのファイルを作業ディレクトリに含める必要があるかなど。
前もって感謝します。
編集:推奨どおりにビルド済みのファイルをダウンロードし、以下のリンクのすべての手順に従いました。
http://www.learncpp.com/cpp-tutorial/a3-using-libraries-with-codeblocks/
.cpp ファイルのプリアンブルに #include "cblas.h" も含めましたが、ビルド メッセージに「cblas_XXXXX」エラーへの未定義の参照が表示されます。これの理由は何ですか?
c++ - GSL での OpenBLAS の使用
どちらの場合も、すべてのデフォルト オプションを使用して GSL と OpenBLAS をソースからコンパイルしました。私の GSL ライブラリは /usr/local/lib に、OpenBLAS は /opt/OpenBLAS/lib にインストールされています。C++ の GSL で OpenBLAS を使用するにはどうすればよいですか?
私がこれを行っている主な理由は、OpenBLAS が Atlas がデフォルト構成で使用していないすべてのコアを使用するためです。私の主な目的は、2 つの大きな行列 (10000 x 10000) を乗算し、2D 畳み込みを実行することです。これには、OpenBLAS または GSL に代わるより良い方法はありますか?
私は使っている:
- Linux ミント 17.2
- GCC バージョン 4.8.4
- 20 コア インテル CPU
OpenBLASを使用してOctaveで同じことを試しています。C++ を使用すると、パフォーマンスが大幅に向上しますか?