問題タブ [c++-amp]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c++ - C++-amp ライブラリとソフトウェア要件
私の Visual Studio バージョンには GPU デバッガー オプションがありません。バージョン自体が原因ですか、それともアップデートをダウンロードする必要がありますか? バージョンは「Microsoft Visual Studio Express 2012 for Windows Desktop Version 11.0.60315.01 Update 2」、「Windows 7 home premium SP1」、ライブラリはどうなっていますか、どこで入手できますか?
winapi - Direct3d 頂点バッファーの使用タイプ、パフォーマンス、および c++amp?
このDirect3dプログラミングのヒントによると、私が書いているプログラムは、フレームごとに重要な計算を適用した後、フレームごとに1回頂点を変更します
このようなタスクには動的バッファを使用する必要がありますが、パフォーマンスは期待できると書かれており、Web を検索すると頂点バッファを更新する最速の方法が見つかりました
Xoofx の回答 (Sharpdx のデザイナー) まで下にスクロールすると、サブリソースの更新は動的バッファーを使用するよりも優れており、私の知る限り、サブリソースの更新はデフォルトのバッファーでのみ使用されます。
どの使用法を使用すればよいですか? (ステージング) とは何ですか?
C++ AMP を使用して計算を行うことにした場合 (GPU をプロセッサとして使用することは理解しています)、バッファの使用をデフォルトに設定し、C++ AMP を使用して CPU からアクセスする方法はありますか?
c++ - アンプ制限機能での不正な外部参照
C++ amp を使用しようとしていて、AMP 制限関数がアクセスする必要がある定数データの静的配列がある場合、どうすれば簡単にそれを行うことができますか (できれば、コードをあまり変更しないでください)。
だから私は配列を持っています:
そしてその配列を使ったアンプ限定ボディ。
c++ - C++ AMP コンストラクター
amp コードで使用される構造体のコンストラクターには、restrict(amp) を含める必要がありますか? 元:
それとも...
gpgpu - C++ AMP のパフォーマンスの問題
C++ AMP を使い始めたばかりですが (学習方法として)、パフォーマンスに関して期待した結果が得られません。助けてください。
解決する問題は非常に単純です。私は Vector と Matrix 構造を持っています (C++ コード、ところで私は C++ の初心者です)。
目標は、同じ行列に何百万ものこれらのベクトルを何度も乗算することです。計算を行うコードは次のとおりです。
これで、このメソッドを CPU または GPU で実行できます。
CPU:
GPU:
このコードを 2020 万のベクトルで実行すると、次の結果が得られます。
- CPU (C++): 226ms
- CPU (C#): 223ms
- GPU : 339ms
そして、私にはいくつかの驚きがあります。まず、C# と C++ のコードはほぼ同じ速度で実行されます。第二に、GPU は期待したほど高速ではありません。
メモリ転送でペナルティを支払わなければならないことは知っていますが、この例ではそれほど目立つとは思いませんでした。投入するデータの量に関係なく、GPU は常に遅くなります。これは、私が何か間違ったことをしていることを意味します。そうしないと、シングル コア CPU に負けたとしても、GPU を使用してゲームをプレイする人は誰もいないでしょう。
質問: この種の計算を CPU よりも GPU で実行する方法はありますか?
ありがとう
参考までに: Windows 7 を実行しています (これにより、WARP を使用できなくなります)、NVIDIA GeForce GTX 690 および Intel Core i7 3930k を搭載しています。