問題タブ [compute-capability]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
cuda - コンパイル時の CUDA デバイス プロパティとコンピューティング機能
ユーザーが を渡してthreads_per_block
カーネルを呼び出すコードがあるとします。次に、入力が有効かどうかを確認します (たとえば、計算能力 CC <2.0 の場合は <=512、CC >=2.0 の場合は 1024)。
nvcc -arch=sm_13
CC2.0 を搭載したコンピューターにグラフィックス カードを搭載しているときに、ユーザーがパスしたときにコードをコンパイルするとどうなるのだろうかthreads_per_block == 1024
? これは:
- 有効な入力 - 私が使用しているカードには CC2.0 があるため、または...
- CC1.3用にコンパイルしたので無効?
それともnvcc -arch=sm_13
、少なくとも CC1.3 は必要ですが、より高い CC で実行すると、それらのより高い機能を使用できるということですか?
cuda - CUDA 機能と CUDA バージョン: 互換性はありますか?
1.1 コンピューティング機能の CUDA GPU を搭載したマシンが 1 台あります。CUDA を再インストールしたいのですが、5.0 を使用すると思います。
CUDA 機能と CUDA のバージョンとの間に互換性などはありますか? CC 1.1 で CUDA 5.0 を使用すると問題が発生しますか? GPU?
ありがとう!
cuda - CUDA での Double 値の処理 (Compute Capability 1.1)
私のコードは、大量のデータセットに対して 3D-DCT を計算しています。
GeForce 9400M、計算機能 1.1 (私の知る限り倍精度をサポートしていません) で実行されています。
それを有効にする方法、または値を正しく処理する方法はありますか?
opencl - OpenCL デバイス情報と CUDA コンピューティング機能
nVIDIA の CUDA にはCompute Capabilityの概念があり、その下で多数の重要な機能フラグと数値パラメーターがまとめられています。OpenCL 側では、 clGetDeviceInfoについては知っていますが、CUDA CC 定義がカバーするものと clGetDeviceInfo が提供するもののセットの違いは非常に重要なようです。また、Intel または AMD が発行した、連続するディスクリートまたは統合 GPU の clGetDeviceInfo 値を含むテーブルは実際にはありません。
OpenCLデバイスが自分自身に関する情報を公開する他のメカニズムはありますか(おそらく標準化されていません)? また、nVIDIA 以外の GPU の計算能力表に相当するものはどこにありますか?
cuda - nVIDIA GPU の計算能力を判断するために、どのユーティリティ/バイナリを呼び出すことができますか?
単一の GPU がインストールされたシステムがあり、最新バージョンの CUDA もインストールされているとします。
GPU の計算能力を判断したいと考えています。コードをコンパイルできれば、それは簡単です。
しかし、コンパイルせずにそれをやりたいとします。できますか?デバイスに関するあらゆる種類の情報を照会できるので、役立つかもしれないと思いnvidia-smi
ましたが、コンピューティング機能を取得できないようです。多分私にできることは他にありますか?/proc
またはシステムログを介して見えるものでしょうか?
編集:これは、私が制御していないシステムで、ビルドの前に実行することを目的としています。そのため、最小限の依存関係を持ち、コマンドラインで実行し、root 権限を必要としない必要があります。