問題タブ [cula]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
303 参照

c - デバイス カーネルから CULA ルーチンを呼び出すことはできますか?

そのため、GPU を使用して小さな過決定方程式系を同時に解くことで大幅な高速化が得られるかどうかを確認しようとしています。私の現在のアルゴリズムでは、CULA Dense ライブラリの LU 分解関数を使用しており、CULA 関数を初期化して実行するために、GPU と CPU の間を行き来する必要があります。CPU に戻ってデータをコピーし直す必要がないように、CUDA カーネルから CULA 関数を呼び出せるようにしたいと考えています。これにより、複数のシステムを同時に解決するために、異なるデータ セットで動作する複数のスレッドを作成することもできます。私の質問は、デバイス関数から CULA 関数を呼び出すことはできますか? CUBLAS と他のいくつかの CUDA ライブラリでそれが可能であることは知っています。

ありがとう!

0 投票する
1 に答える
138 参照

lapack - culaSgels の cula の使用 - 間​​違った引数ですか?

Ax=B を解くために culaSgels 関数を使用しようとしています。

cula パッケージの systemSolve の例を修正しました。

私はculaSgels('N',N,N, NRHS, A, N, A, N);システムを解決するために使用していますが:

1) 結果は、 X=0 のすべての要素が B が正しいことを示しています。また、それは私に

結果チェック失敗メッセージ

2)リファレンスマニュアルを調べると、最後の引数(AIが持っている)の前の1つの引数は、列ごとに格納された行列Bである必要がありますが、「A」の代わりに「B」をパラメータとして使用すると、得られません正しい B 行列。

0 投票する
1 に答える
303 参照

cuda - culaデバイスの使い方

cula デバイス インターフェイスの使用方法について少し混乱しています。現在、cpp ファイルで cula インターフェイスを使用しており、cu ファイルからいくつかの乱数を生成しています。

cu ファイル:

cpp ファイル:

そのため、cu ファイルからホスト メモリを割り当て、それを cpp ファイルに渡します。

culaデバイスを使用したい場合は?

メモリ転送を管理する方法がわかりません。