問題タブ [openblas]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
57 参照

x86 - OpenBLAS は、任意のサイズのベクトルと行列をどのようにサポートしますか?

任意のサイズの行列とベクトルの高速なベクトル化された線形代数計算をサポートするために何が必要かを理解しようとしています。x86 プロセッサ アーキテクチャについて私が理解していることから、制限されたサイズの特殊なレジスタが含まれています。これらのレジスターを使用すると、浮動小数点数をロードしたり、操作をレジスター全体にブロードキャストしたりできます。限られたサイズを効率的に回避するにはどうすればよいですか?

これを理解するためにOpenBLASのソースコードを見ていましたが、開発ドキュメントを見ても、 などの単純な操作の一般的な流れを理解できませんでしたgemv

0 投票する
0 に答える
136 参照

r - 再現可能なRコンテナでRでOpenblasを使用する

再現可能な科学的機械学習とハイパーパラメーターの最適化に R を使用しています。openblas/atlas/klm などの blas の他の実装が、このコストのかかる最適化を高速化できるという事実に出くわしました。ただし、デフォルトの R から逸脱するシングル スレッドの結果で最適化が強制された場合でも、各 blas を使用した結果はわずかに異なります。

だから私はDockerを使って実験を封じ込めたいと思っています。複数の質問があります。

  1. バイナリの代わりにソースからコンパイルするのは良いですか?

  2. ソースからコンパイルすると、debian バイナリと同じ構成になりますか?

  3. blasごとに結果が違うので、BerkeleyからReproBLASというツールがありますが、Rで使ってみてはいかがでしょうか?

  4. 「--with-blas=-lopenblas」を使用してRをコンパイルすると、この場合、openblasはシングルスレッドまたはマルチスレッドですか?