問題タブ [tesla]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
cuda - Nvidia Tesla vs 480 forCUDAプログラミング
私はCUDAプログラミングの研究をしています。
NVidia Teslaを1つ購入するか、4〜5 NVidia 480を購入するかを選択できますか?
おすすめは何ですか?
multithreading - nvidia Tesla のスレッドの総数
nvidia Tesla で同時に実行できるスレッドの総数はいくつですか (S1070 など)。
directx - TeslaアダプターのCUDAと別のNVIDIAアダプターのフルスクリーンDXウィンドウ
TeslaX2050アダプターでCUDAを使用して処理を行うアプリケーションがあります。私のシステムにはQudaro4000もありますが、この目的のためにアプリケーションでは使用されません。さらに、パターンを表示するために使用される別のGeforce2xxグラフィックカードがあります。パターンを表示する部分は、GeForce2xxアダプター上にフルスクリーンDX9デバイスを作成し、表示フレームごとに異なるパターンを表示するコードです。この目的のために、VSynchedを表示する必要があり、パターンをスキップしたり見逃したりしないようにする必要があります。私が抱えている問題は、VSyncをオンにすると、すべてのCUDA処理が非常に遅くなることです。VSynchを無効にすると、望ましくないパターンが途切れてしまいます。CUDA処理とパターン表示の両方をどのように組み合わせることができますか?文脈のために、
2011年1月4日編集:シーケンスが1台のコンピューターに完全に投影される理由と、より強力なコンピューターで画像が時々停止する理由を発見しました。違いは、1つにはオンボードのIntel GPUがあり、もう1つには3つのNVIDIAGPUがあることです。さて、この特定のタスクでは、オンボードIntelGPUはどのNVIDIAGPUよりもはるかに優れています。ドライバーが異なることが原因である可能性があります。IntelGPUと同じ完璧なパフォーマンスを実現するために、NVIDIAドライバーに設定するオプションとパラメーターの組み合わせがあるかどうかを調べています。
ありがとうございました。
オファー。
cuda - NVidia CUDA:TeslaT10プロセッサとTeslaM2090プロセッサの違い
有限差分計算を実行するCUDAコードがあります。このコードは、TeslaM2090プロセッサでエラーなしで正常に機能します。同じコードを使用すると、TeslaT10プロセッサで多くのエラーが発生します。結果に多くのゼロが含まれています。
これら2つのアーキテクチャの違いと問題を解決する方法の解決策を知っている人はいますか
mysql - Webサーバー用のTeslaベースのサーバー?
たとえば、apache と mysql をインストールすることにより、通常のサーバーと同じように、tesla ベースのサーバー (明確にするために Tesla GPU を使用) を Web サーバーとして使用できるかどうかを知りたいのですが?
可能であれば、Tesla GPU のパワーを効率的に使用して、CPU とほぼ同じ作業を行うかどうかを知りたいです??
回答ありがとうございます:)
opencl - nVidia テスラ カードに利点はありますか?
(予算 2k-4k) で並列アルゴリズムを実行するための本格的な GPU を購入する予定です。今では、「特に GPGPU 用に作られた」nVidia Tesla GPU カードを搭載したスーパーコンピューターをいたるところで見かけます。
これは一見非常に良いように思えますが、よりよく読むと、それについて真剣に考え直します。たとえば、Radeon HD 7970 と比較すると、そのパフォーマンス (フロップの観点から) は大幅に低く、コストは大幅に高くなります。 Tesla と通常のゲーム用 GPU のベンチマーク比較が見つからないようです。
Tesla には ECC メモリが搭載されていることがわかりました。違いはこれだけですか?それとも、両者のより深いアーキテクチャの違いを見逃していますか? おそらく関連情報:CudaではなくOpenCLを使用します。
cuda - 私の比較研究に対するFermiアーキテクチャの可能な解決策は?
私は、アルゴリズムのシリアルバージョンとパラレルバージョンを比較する必要がある比較研究に取り組んでいます(正確なダウンロードリンクはここにあるNSGA-IIアルゴリズム)。NSGA-IIはヒューリスティックな最適化手法であるため、生成された最初のランダムな母集団に依存します。CPUとGPUを使用して生成された初期の母集団が異なる場合、公平な高速化の調査を行うことはできません。
私は、1.3の計算能力を持つNVIDIA-TESLA-C1060カードを持っています。この回答とこのNVIDIAドキュメントによると、sm_13デバイスが常にIEEE-754準拠のfloat(単精度)値を生成することは期待できません。つまり、現在のデバイスでは、対応するシリアルに対応するCUDAプログラムの公平な高速化調査を実施できません。
私の質問は、Fermiアーキテクチャに切り替えることで問題は解決するでしょうか?
cuda - sm_20 で nan を取得
テスラC2050を使用しています。「-arch=sm_20」を指定してコードを実行したいのですが、「-arch=sm_13」を使用すると計算が正しいのに -nan が返されますか?! 問題は何を解けばいいですか?
ありがとう、ベザド
gpu - GeForce に対する Tesla の利点
これら 2 つのシリーズのカードの違いについて、インターネットで見つけた情報をいくつか読みましたが、どうやら広告のように感じずにはいられません。最も強力な GeForce の価格は約 700 ドルですが、Tesla の開始価格は約 2500 ドルであり、それは大きな違いです。
最大の利点の間にリストされている ECC メモリは興味深いものですが、それがその違いを説明しているとは思えません。2 番目に強調されていることは、倍精度数のパフォーマンスがはるかに優れていることですが、主に整数演算に焦点を当てるので、それほど重要ではありません。上位の GeForce カードには大量のメモリも搭載されています。どちらのシリーズも GDDR5 を使用していますが、GeForce のメモリ帯域幅は Tesla よりもさらに高くなっています。
これらの 2 つのシリーズを客観的に比較した個人的な経験がある人はいますか? テスラのコストのほとんどは、パフォーマンスではなく、プレミアム ツールとサポートに関連していると思うからです。
cuda - Cuda::Entry関数が使用するローカルデータが多すぎます
TeslaC2075でPolygonIntersectionに対して1つのアルゴリズムを実行しようとしていますが、このアルゴリズムをコンパイルしようとすると、コンパイラーからエラーが発生します:"Entry Function 'Polygon_Intersection'uses too much local data(0x40e8 bytes,0x4000)
。
私のアルゴリズムは少し複雑で、カーネル内の多くのローカル変数を利用しています。だから私の質問は、各カーネルのローカル変数宣言にグローバルメモリを使用できるか、または何らかの方法で共有メモリを使用できるかなど、この問題を解決する方法はありますか?