問題タブ [aleagpu]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
0 に答える
43 参照

aleagpu - random モジュールが期待どおりに動作しない

random モジュールを連続して実行すると、同じ結果が得られます。これを修正する方法はありますか?Alea に関するドキュメントは、いくつかの場所で非常にまばらです。

0 投票する
1 に答える
761 参照

aleagpu - Aleaをより速くする方法は?

Alea でさまざまな ML アルゴリズムを実装するいくつかの作業を行ったので、Alea でいくつかの単純だが不可欠なルーチンのベンチマークを試みました。Alea' は、同じことを行う sgeam への同等の cuBLAS 呼び出しよりも約 3 倍の時間がかかることを知って驚きました。共有メモリを操作しなければならない行列乗算のようなもっと複雑なことをしていたら、これは理解できたでしょうが、以下は単純な配列変換です。

DeviceUnaryTransformModule 変換モジュールのカーネルは、基本的な変換の例と同じです。唯一の違いは、後でホストにデータを収集する代わりに、デバイス上にデータを保持することです。

また、Unbound の reduce は、私にとっては非常にうまく機能しません。行列を合計するために sgeamv を 2 回使用するよりも約 20 倍遅くなります。

これを CUDA C++ と比較しようとしたことはありませんが、単純なことでは cuBLAS と同等であると思います。最適化フラグがオフになっているのではないかと思ったのですが、デフォルトでオンになっていることがわかりました。ここで見逃している最適化のヒントはありますか?

0 投票する
1 に答える
28 参照

aleagpu - カーネル内のデバイス アーキテクチャを取得する方法は?

タイトルが求めるとおりです。両方

コンパイルに失敗します。

0 投票する
1 に答える
163 参照

aleagpu - DeviceReduceModule は IL ファイルを見つけることができません

上記は関連するスニペットです。私は Alea を正しくセットアップしなかったと推測していますが、面倒なことは、他のすべてが完全に機能することです。以下のコードのこの部分だけが例外をスローします。

私はすべての作業を F# スクリプト モードで行っています。設定方法は次のとおりです。

私自身のコード、CuBlas、Unbound のランダム モジュール、Unbound のブロック リデュースとスキャン、そしてDeviceSumModuleF32私のための作業です。Alea.CUDA.Settings.Instance.Resource.AssemblyPathとをさまざまなライブラリ ディレクトリに向けてみAlea.CUDA.Settings.Instance.Resource.Pathましたが、まったく何もしていないようです。過去数週間、まったく設定していなくても、邪魔にはなりませんでした。app.config ファイルには触れていません。構成方法がわからず、構成ファイルを手動で編集するのが苦手なためです。

何かアドバイス?

0 投票する
1 に答える
97 参照

aleagpu - Alea でメモリ リークを見つける

しばらく実行した後に Cuda のメモリ不足例外をスローするスクリプトがいくつかあります。それらの内部では、事前に割り当てられた配列を使用しているため、これが問題になるとは思っていませんでした。それにもかかわらず、スクリプトを .fs ファイルに変換してコンパイルした後、プロファイラーはこのタスクには特に役に立たず、cuda-memcheck ツール 6.5 (36) を使用すると CudaInterOp 例外がスローされました。cuda-memcheck 7.0 (40) は、GPU が故障したため、実際に PC を強制的にリセットさせました。

私は現時点で何をすべきかについて少し確信が持てません。Aleaでリークを修正するにはどうすればよいですか?

0 投票する
1 に答える
161 参照

c - AleaGpu を使用して多次元の配列をカーネルにコピーするにはどうすればよいですか?

多次元の配列を AleaGPU のカーネルにコピーするにはどうすればよいですか? Kernel で多次元配列を使用して開発するにはどうすればよいですか?

マロックはそれを受け入れていないようですか?