問題タブ [cublas]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
cuda - Cublasを理解する:ベクトル加算(asum)
CUBLASリファレンスによると、asum関数(ベクトルの要素の合計を取得するため)は次のとおりです。
参照へのリンクでパラメータの説明を見ることができます。大まかに言って、要素間の距離を持つ要素のベクトルx
があります。n
incx
私のコードは(かなり単純化されていますが、これもテストしましたが、まだエラーがあります):
コードを単純化するためにエラーチェックを削除しました(エラーはありません。CUBLAS関数は戻りますCUDA_STATUS_SUCCESS
)。free
cudaFree
コンパイルして実行し、エラーをスローしませんが、出力される結果は0
、デバッグでは実際には1.QNAN
です。
私は何を取りこぼしたか?
eclipse - Eclipse Nsightでcublasライブラリにリンクするには?
simpleCUBLAS の Nvidia のサンプル コードを使用しています。この例には Makefile が付属しています。または、次のようにコンパイルできます。
g++ -m32 -I/usr/local/cuda/include -I. -o simpleCUBLAS.o -c simpleCUBLAS.cc g++ -m32 -o simpleCUBLAS simpleCUBLAS.o -L/usr/local/cuda/lib -l cudart -l cublas
(「-I.」によって含まれるファイルは cuda_runtime.h helper_cuda.h helper_string.h です)
これは問題なくコンパイルされ、実行されます。ただし、CUDA 用の Eclipse の Nsight エディターを使用してこれを作成したいと考えています。
私の質問は次のとおりです。これらのオプションを Eclipse に追加するにはどうすればよいですか (-L/usr/local/cuda/lib -l cudart -l cublas、および -I.) Nsight?
その他の詳細: Linux を使用しています。Eclipse と c/c++ プロジェクトに関する情報を他の場所で見たことがありますが、ここでは cuda c/c++ プロジェクトを使用しています。
ありがとう。
cuda - cublas は停止イベントの同期に失敗しましたか?
私はmatrixMulCUBLASサンプル コードで遊んでいて、デフォルトのマトリックス サイズをもう少し楽しいものに変更しようとしましたFailed to synchronize on the stop event (error code unknown error)!
。どうやらcublasを片付けているようです。これは何を意味するのでしょうか?どうすれば修正できますか?
EVGA FTW nVidia GeForce GTX 670
2GBのメモリを搭載したcuda 5.0がインストールされています。ドライバーのバージョンは、本日時点で最新の 314.22 です。
c - CUBLAS で出力行列を格納するために、入力行列も使用できますか?
たとえば、次のcublas<t>geam()
ようにします。
A
しかし、とにかく結果を保存したい場合はどうすればよいですか? 次のようにポインターを使用して呼び出すことはできますか*C = *A
?
まだ入力として読み取られているマトリックスに出力を書き込む可能性があることを恐れずに??
もしそうなら、他のすべての CUBLAS 行列操作でこれを安全に行うことが保証されていますか?
pointers - CUBLAS がパラメーターに const ポインターを使用するのはなぜですか?
例えば、
これは、多くの混乱点に関連しています。
- は何
const
を達成しますか? - スカラー パラメータに対してもポインタを提供する必要があるのはなぜですか?
- これは何と関係があり
CUBLAS_POINTER_MODE_HOST
ますか? const
それらを渡すために一時変数を明示的に作成する必要がありますか、それとも通常のポインターで行いますか?
c - 転置時の CUBLAS のリーディング ディメンションの明確化
マトリックスのA
場合、ドキュメントには、対応する主要な次元パラメーターが次のものlda
を参照しているとのみ記載されています。
行列 A を格納するために使用される 2 次元配列の最初の次元
したがって、これは、A
特定の CUBLAS の列主要ストレージ形式の行数に過ぎないと推測します。しかし、私たちが考えるときOp(A)
、主要な次元は今何を指していますか?
c++ - テンプレート関数内で CUBLAS ライブラリを使用するには?
CUBLAS にはデータの種類ごとに個別の関数がありますが、テンプレート内から CUBLAS を呼び出したいです。
正しい関数呼び出しをトリガーするにはどうすればよいですか?
c++ - C++ と cublas コードの混合がコンパイルされない
したがって、マトリックスの内積をさまざまな方法で計算すると思われるこのコードがありますが (そのうちの 1 つは C++ で blas を使用することです)、nvcc を使用してコードをコンパイルしようとすると、機能しません。 ddot への未定義の参照があると言っています。ここで参照されている cublas の呼び出し表記法を使用していると確信しているため、これは奇妙です: http://www.sdsc.edu/us/training/assets/docs/NVIDIA-03-Toolkit.pdf
誰でも私を助けることができますか?ここに私が問題を抱えているコードの抜粋があります:
これは私には奇妙です。また、「_」を削除しようとしましたが、うまくいきませんでした。
私が使用するコンパイルコマンドは次のとおりです。nvcc program
どういうわけか、コンパイル中に cublas ライブラリについて言及する必要がありますか? cudaツールキットをインストールしましたが、ライブラリを参照する方法がわかりません
#include <cublas.h>
新しいアップデート
cublas.h ヘッダーを含めても含めなくても、同じ出力が得られることがわかりました。
-lcublas と入力しても入力しなくても、同じ出力が得られます。
これは、すべてのコンパイルのガベージである出力です(cublas.hの有無と-lcublasの有無)