問題タブ [openblas]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c++ - Armadillo + OpenBLAS マルチスレッド
Ubuntu 14.04 64 ビット (Armadillo がインストールされている場合とインストールされていない場合の両方)の修士論文で、ArmadilloをOpenBLASと組み合わせて使用することに成功しました。パフォーマンスは非常に印象的でした。私のコードは主に基本的な行列演算で構成されていました。これらはすべて、利用可能なすべてのスレッドを使用して実行されました。
今、Visual Studio 2013 のWindows 7 64 ビット マシンで OpenBLAS を使用して Armadillo を使用しようとしています。オンラインでいくつかのヘルプを見つけ、 PThreadライブラリを正常に追加しました。コード自体は機能しますが、パフォーマンスはよくありません。1000x1000行列を使用して、加算、乗算、要素ごとの乗算の3 つの基本演算をテストします。これら 3 つのうち、古典的な乗算だけがすべての CPU パワーを使用します。他の 2 つは 25% の CPU を使用しており、シングル スレッドで実行されていることを示しています。
Ubuntu の場合、この動作に遭遇したことはありません。誰か提案はありますか?誰かが同様の問題を抱えているリンクを見たことがありません。
python - Cython の prange は 4 スレッドの場合、range の場合より遅くなります
私は現在、cython の prange でループを並列化するための簡単な例に従おうとしています。openmpを許可してopenblas 0.2.14をインストールし、openblasに対してソースからnumpy 1.10.1とscipy 0.16をコンパイルしました。ライブラリのパフォーマンスをテストするために、次の例に従っています: http://nealhughes.net/parallelcomp2/。時間を計測する関数は、サイトからコピーされます。
コードの作成者は、次の 4 コアの速度向上を報告しています。
これらの例を自分のマシン (osx 10.10 を搭載した macbook pro) で実行すると、次のエクスポートのタイミングが得られます。OMP_NUM_THREADS=1
そしてOMP_NUM_THREADS=4
openSuse マシンでも同じ動作が見られるので、質問します。私のシステムの 2 つで 4 つのスレッドに対して同じコードの実行が遅くなるのに、作成者はどうすれば 4 倍の速度を上げることができるでしょうか。
を生成するためのセットアップ スクリプト*.c & .so
も、ブログで使用されているものと同じです。
なぜこれが起こるのか誰かが私に説明できれば素晴らしいでしょう.
python - OpenBLAS Lapack が Theano Windows で利用できないのはなぜですか?
私は Windows 10 64 ビットを使用しており、すでに theano をインストールしています。http://sourceforge.net/projects/openblas/files/v0.2.15/OpenBLAS-v0.2.15-Win64-int32.zip/downloadから OpenBLAS をダウンロードし、libopenblas.dll もC:\openblas and other dll
ファイルに入れましminGW64_dll
た。
私の.theanorc
ファイル:
走ろうとするとC:\Anaconda2\Lib\site-package\theano\misc\check_blas.py
私はこのようなものを得ました:
よくわかりませんが、次のように書かれています。
それが正しいか?または何かがエラーですか?
コマンドを使用してldflagsを印刷しようとしました
そして、私は正しい出力を得たと思います
では、check_blas.py を使用してテストすると、openblas ステータスが利用できないのはなぜですか?
私はTheanoの初心者なので、ここにいる誰かが私を助けてくれることを願っています、ありがとう
python - Ubuntu (percise): libopenblas-dev が利用できない (Chromebook/Crouton)
ラップトップ: Asus C100P Chromebook
OS: CromeOS with Crouton (chroot) Ubuntu Percise Ver 12.04.5 LTS
Numpy と Theano を使用して Python 環境をセットアップしようとしています。
出力
BLAS パッケージを利用できないことを示唆するリソースはないようです。【libopenblas-dev perciseのインストール方法】
私の限られた知識によると、[この]ページは、ARMプロセッサもパッケージに問題がないことを示していますよね?
このパッケージをインストールする別の方法はありますか?
編集: インストールしようとしていたパッケージ (numpy と theano) は、この問題を解決しなくても動作するようです。BLAS は ChromeOS のベース/ネイティブ機能になる可能性がありますか? (libopenblas-devが将来のユーザーにとって問題になる可能性がある場合に備えて、質問を開いたままにします)
r - How to make openBLAS work with openMP?
I got tons of warning from openBLAS like
OpenBLAS Warning : Detect OpenMP Loop and this application may hang. Please rebuild the library with USE_OPENMP=1 option.
OpenBLAS Warning : Detect OpenMP Loop and this application may hang. Please rebuild the library with USE_OPENMP=1 option.
OpenBLAS Warning : Detect OpenMP Loop and this application may hang. Please rebuild the library with USE_OPENMP=1 option.
OpenBLAS Warning : Detect OpenMP Loop and this application may hang. Please rebuild the library with USE_OPENMP=1 option.
OpenBLAS Warning : Detect OpenMP Loop and this application may hang. Please rebuild the library with USE_OPENMP=1 option.
OpenBLAS Warning : Detect OpenMP Loop and this application may hang. Please rebuild the library with USE_OPENMP=1 option.
OpenBLAS Warning : Detect OpenMP Loop and this application may hang. Please rebuild the library with USE_OPENMP=1 option.
OpenBLAS Warning : Detect OpenMP Loop and this application may hang. Please rebuild the library with USE_OPENMP=1 option.
Here is what my src/Makevars file looks like
And here is my header file:
openMP is used in my code like this
where n_threads
is passed via function argument. Everything is fine when n_threads = 1
but got the above warnings when n_threads = 2
.
A complete code can be found here, which depends on other files as well (sorry I cannot paste here as it is a bit long).
I tried adding USE_OPENMP=1
to src/Makevars, but it does not work. Any body has a solution? Thank you!