問題タブ [cublas]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
2947 参照

cuda - Cublasを理解する:ベクトル加算(asum)

CUBLASリファレンスによると、asum関数(ベクトルの要素の合計を取得するため)は次のとおりです。

参照へのリンクでパラメータの説明を見ることができます。大まかに言って、要素間の距離を持つ要素のベクトルxがあります。nincx

私のコードは(かなり単純化されていますが、これもテストしましたが、まだエラーがあります):

コードを単純化するためにエラーチェックを削除しました(エラーはありません。CUBLAS関数は戻りますCUDA_STATUS_SUCCESS)。freecudaFree

コンパイルして実行し、エラーをスローしませんが、出力される結果は0、デバッグでは実際には1.QNANです。

私は何を取りこぼしたか?

0 投票する
1 に答える
6204 参照

eclipse - Eclipse Nsightでcublasライブラリにリンクするには?

simpleCUBLAS の Nvidia のサンプル コードを使用しています。この例には Makefile が付属しています。または、次のようにコンパイルできます。

g++ -m32 -I/usr/local/cuda/include -I. -o simpleCUBLAS.o -c simpleCUBLAS.cc g++ -m32 -o simpleCUBLAS simpleCUBLAS.o -L/usr/local/cuda/lib -l cudart -l cublas

(「-I.」によって含まれるファイルは cuda_runtime.h helper_cuda.h helper_string.h です)

これは問題なくコンパイルされ、実行されます。ただし、CUDA 用の Eclipse の Nsight エディターを使用してこれを作成したいと考えています。

私の質問は次のとおりです。これらのオプションを Eclipse に追加するにはどうすればよいですか (-L/usr/local/cuda/lib -l cudart -l cublas、および -I.) Nsight?

その他の詳細: Linux を使用しています。Eclipse と c/c++ プロジェクトに関する情報を他の場所で見たことがありますが、ここでは cuda c/c++ プロジェクトを使用しています。

ありがとう。

0 投票する
1 に答える
2062 参照

cuda - cublas は停止イベントの同期に失敗しましたか?

私はmatrixMulCUBLASサンプル コードで遊んでいて、デフォルトのマトリックス サイズをもう少し楽しいものに変更しようとしましたFailed to synchronize on the stop event (error code unknown error)!。どうやらcublasを片付けているようです。これは何を意味するのでしょうか?どうすれば修正できますか?

EVGA FTW nVidia GeForce GTX 6702GBのメモリを搭載したcuda 5.0がインストールされています。ドライバーのバージョンは、本日時点で最新の 314.22 です。

0 投票する
1 に答える
110 参照

c - CUBLAS で出力行列を格納するために、入力行列も使用できますか?

たとえば、次のcublas<t>geam()ようにします。

C = αop(A) + βop(B)

Aしかし、とにかく結果を保存したい場合はどうすればよいですか? 次のようにポインターを使用して呼び出すことはできますか*C = *A?

A = αop(A) + βop(B)

まだ入力として読み取られているマトリックスに出力を書き込む可能性があることを恐れずに??

もしそうなら、他のすべての CUBLAS 行列操作でこれを安全に行うことが保証されていますか?

0 投票する
3 に答える
879 参照

pointers - CUBLAS がパラメーターに const ポインターを使用するのはなぜですか?

例えば、

これは、多くの混乱点に関連しています。

  • は何constを達成しますか?
  • スカラー パラメータに対してもポインタを提供する必要があるのはなぜですか?
  • これは何と関係がありCUBLAS_POINTER_MODE_HOSTますか?
  • constそれらを渡すために一時変数を明示的に作成する必要がありますか、それとも通常のポインターで行いますか?

CUBLAS ライブラリ

0 投票する
2 に答える
11985 参照

c - 転置時の CUBLAS のリーディング ディメンションの明確化

マトリックスのA場合、ドキュメントには、対応する主要な次元パラメーターが次のものldaを参照しているとのみ記載されています。

行列 A を格納するために使用される 2 次元配列の最初の次元

したがって、これは、A特定の CUBLAS の列主要ストレージ形式の行数に過ぎないと推測します。しかし、私たちが考えるときOp(A)、主要な次元は今何を指していますか?

0 投票する
1 に答える
590 参照

c++ - テンプレート関数内で CUBLAS ライブラリを使用するには?

CUBLAS にはデータの種類ごとに個別の関数がありますが、テンプレート内から CUBLAS を呼び出したいです。

正しい関数呼び出しをトリガーするにはどうすればよいですか?

0 投票する
1 に答える
1003 参照

c++ - C++ と cublas コードの混合がコンパイルされない

したがって、マトリックスの内積をさまざまな方法で計算すると思われるこのコードがありますが (そのうちの 1 つは C++ で blas を使用することです)、nvcc を使用してコードをコンパイルしようとすると、機能しません。 ddot への未定義の参照があると言っています。ここで参照されている cublas の呼び出し表記法を使用していると確信しているため、これは奇妙です: http://www.sdsc.edu/us/training/assets/docs/NVIDIA-03-Toolkit.pdf

誰でも私を助けることができますか?ここに私が問題を抱えているコードの抜粋があります:

これは私には奇妙です。また、「_」を削除しようとしましたが、うまくいきませんでした。

私が使用するコンパイルコマンドは次のとおりです。nvcc program

どういうわけか、コンパイル中に cublas ライブラリについて言及する必要がありますか? cudaツールキットをインストールしましたが、ライブラリを参照する方法がわかりません

#include <cublas.h>

新しいアップデート

cublas.h ヘッダーを含めても含めなくても、同じ出力が得られることがわかりました。

-lcublas と入力しても入力しなくても、同じ出力が得られます。

これは、すべてのコンパイルのガベージである出力です(cublas.hの有無と-lcublasの有無)