問題タブ [compute-capability]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
648 参照

cuda - コンパイル時の CUDA デバイス プロパティとコンピューティング機能

ユーザーが を渡してthreads_per_blockカーネルを呼び出すコードがあるとします。次に、入力が有効かどうかを確認します (たとえば、計算能力 CC <2.0 の場合は <=512、CC >=2.0 の場合は 1024)。

nvcc -arch=sm_13CC2.0 を搭載したコンピューターにグラフィックス カードを搭載しているときに、ユーザーがパスしたときにコードをコンパイルするとどうなるのだろうかthreads_per_block == 1024? これは:

  • 有効な入力 - 私が使用しているカードには CC2.0 があるため、または...
  • CC1.3用にコンパイルしたので無効?

それともnvcc -arch=sm_13、少なくとも CC1.3 は必要ですが、より高い CC で実行すると、それらのより高い機能を使用できるということですか?

0 投票する
1 に答える
5001 参照

cuda - CUDA 機能と CUDA バージョン: 互換性はありますか?

1.1 コンピューティング機能の CUDA GPU を搭載したマシンが 1 台あります。CUDA を再インストールしたいのですが、5.0 を使用すると思います。

CUDA 機能と CUDA のバージョンとの間に互換性などはありますか? CC 1.1 で CUDA 5.0 を使用すると問題が発生しますか? GPU?

ありがとう!

0 投票する
0 に答える
134 参照

cuda - CUDA での Double 値の処理 (Compute Capability 1.1)

私のコードは、大量のデータセットに対して 3D-DCT を計算しています。

GeForce 9400M、計算機能 1.1 (私の知る限り倍精度をサポートしていません) で実行されています。

それを有効にする方法、または値を正しく処理する方法はありますか?

0 投票する
1 に答える
675 参照

opencl - OpenCL デバイス情報と CUDA コンピューティング機能

nVIDIA の CUDA にはCompute Capabilityの概念があり、その下で多数の重要な機能フラグと数値パラメーターがまとめられています。OpenCL 側では、 clGetDeviceInfoについては知っていますが、CUDA CC 定義がカバーするものと clGetDeviceInfo が提供するもののセットの違いは非常に重要なようです。また、Intel または AMD が発行した、連続するディスクリートまたは統合 GPU の clGetDeviceInfo 値を含むテーブルは実際にはありません。

OpenCLデバイスが自分自身に関する情報を公開する他のメカニズムはありますか(おそらく標準化されていません)? また、nVIDIA 以外の GPU の計算能力表に相当するものはどこにありますか?

0 投票する
2 に答える
4304 参照

cuda - nVIDIA GPU の計算能力を判断するために、どのユーティリティ/バイナリを呼び出すことができますか?

単一の GPU がインストールされたシステムがあり、最新バージョンの CUDA もインストールされているとします。

GPU の計算能力を判断したいと考えています。コードをコンパイルできれば、それは簡単です。

しかし、コンパイルせずにそれをやりたいとします。できますか?デバイスに関するあらゆる種類の情報を照会できるので、役立つかもしれないと思いnvidia-smiましたが、コンピューティング機能を取得できないようです。多分私にできることは他にありますか?/procまたはシステムログを介して見えるものでしょうか?

編集:これは、私が制御していないシステムで、ビルドの前に実行することを目的としています。そのため、最小限の依存関係を持ち、コマンドラインで実行し、root 権限を必要としない必要があります。