問題タブ [nvidia]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
cuda - 異なるCUDASDK間のパフォーマンスの違いは?
nVidiaのCUDASDKの能力を活用するようにアプリケーションを書き直したい場合、異なるSDK製品(C ++、Java、Python)間で実行時のパフォーマンスにまったく違いはありますか?
使用されている明らかな言語以外に、これら3つのSDKの間にまったく違いはありますか?
visual-studio-2010 - VS2008 をインストールせずに VS2010 用の Nvidia Parallel NSight (Nexus) をインストールするにはどうすればよいですか?
Parallel NSight をインストールして、VS2008 SP1 をインストールせずに Visual Studio 2010 で使用する方法はありますか?
セットアップは VS2008 がインストールされているかどうかを確認し、インストールされていない場合は続行しません。VS2010 の正式なサポートがないことは知っていますが、フォーラムで Nexus を VS2010 に統合できる小さなアプリケーションを見つけたところ、動作しているようです。
compilation - NVIDIACUDASDKの例コンパイルサポートされていないアーキテクチャ'compute_20'
CUDA SDKのコンパイル時に、nvccが致命的です:サポートされていないgpuアーキテクチャ'compute_20'私のツールキットは2.3であり、共有システム上にあり(つまり、実際にはアップグレードできません)、ドライバーバージョンも2.3であり、4テスラC1060で実行されています
それが役立つ場合、問題は基数ソートで呼び出されています。
オンラインでこの問題を抱えている人が何人かいるようですが、実際に解決策を提供する場所は見つかりませんでした。
cuda - CUDAのグローバルメモリに対する不可分操作は、ワープ全体で並行して実行されますか?
CC2.0デバイスのグローバルメモリでアトミックFP追加操作を実行する必要があります。ワープで参照されるグローバルデータが整列された128バイトのセクターに適合する場合、これらの操作は並行して実行されますか、それとも一度に1つずつ実行されますか?
私の推測では、それらは並列であると思いますが、これはわかりません
よろしくGauthamGanapathy
timeout - CUDAのタイムアウト?/フェルミ/gtx465
GPU GTX4651GBを搭載したMSVS2005でCUDASDK3.1を使用しています。私はそのようなカーネル関数を持っています:
これはカーネル関数を呼び出す関数です。
この関数のすべてのパラメーターをループでロードしています(たとえば、1回のループ反復でパラメーターごとに4096個の要素)。合計すると、すべてのループの反復後に、各パラメーターの32768要素に対してこのカーネルを作成したいと思います。
MAX_FINAL_Xは1920で、MAX_FINAL_Yは1080です。
alghoritmを開始すると、最初の反復が非常に速くなり、さらに1〜2回反復すると、CUDAタイムアウトエラーに関する情報が得られます。私はGPUgtx260でこのアルゴリズムを使用しましたが、覚えている限りではうまくいっていました...
私を助けてくれませんか..このアルゴリズムの新しいFermiアーチによると、私はいくつかの間違いをしているのでしょうか?
c - CUDA基本マトリックスの追加-大きなマトリックス
2つの4800x9600マトリックスを追加しようとしていますが、問題が発生しています...
これは単純なC=A+B操作です...
カーネルは次のとおりです。
そしてここにコードがあります:
私は次のようにマトリックスを使用しています:
そして、これが上10行と下10行を印刷したときの出力です。
ご覧のとおり、C = A+Bが機能していません...
マトリックスの上部は問題ありませんが、下半分は干し草のように見えます。これらすべてのゼロがどこから来ているのかわかりません...
私は何か間違ったことをしていますか?
どんな洞察も大歓迎です。よろしくお願いします。
matrix - CUDA 行列の行を追加
4800x9600 マトリックスの行を一緒に追加しようとすると、マトリックス 1x9600 になります。
私が行ったことは、4800x9600 をそれぞれ長さ 4800 の 9,600 の行列に分割することです。次に、4800 要素に対して削減を実行します。
問題は、これが本当に遅いことです...
誰にも何か提案がありますか?
基本的に、MATLAB の sum(...) 関数を実装しようとしています。
これは私が正常に動作することを確認したコードです。それは本当に遅いだけです:
行列は次のように定義されます。
ReduceTotal() は、標準の NVIDIA リダクションを呼び出すだけで、Dchunk のすべての要素を合計し、その答えを DcolSum に入れます。
答えが見つからない場合は、CPUでこれをすべて実行しようとしています... ;(
よろしくお願いします。
c++ - サイズが大きすぎると glBufferData がサイレントに失敗する
サイズ: 1085859108 およびデータ: NULL で呼び出しようとすると、glBufferData がサイレントに失敗することに気付きました。
次の glBufferSubData への呼び出しは、OUT_OF_MEMORY 'Exception' で失敗します。これは、Windows XP 32 ビット、NVIDIA Gforce 9500 GT (1024MB)、および 195.62 ドライバー上にあります。
バッファが正常に作成されたかどうかを判断する方法はありますか? (例えばプロキシテクスチャのようなもの?)
よろしく、フロリアン
linux - Linux で X.org を使用しない OpenGL
Linux で X なしで OpenGL コンテキストを開きたいです。それを行う方法はまったくありますか?
ほとんどの人はシステムにNvidiaカードを持っていますが、統合されたIntelグラフィックスカードハードウェアで可能であることは知っています. Nvidia カードで動作するソリューションが欲しいです。
統合された Intel ハードウェアを使用する以外に方法がない場合は、それがどのように行われるかを知っていればよいと思います。
X11 プロトコル自体が大きすぎて複雑です。それが提供するマウス/キーボード/タブレット入力の多重化は、現代のプログラムにはあまりにも骨抜きにされています。Linux デスクトップの改善を妨げている最悪の障害だと思います。そのため、代替手段を探しています。
winsock - NVIDIA Quadro を搭載したマシンでのみ頻繁に発生するクライアント側の WSAECONNABORTED を調査するにはどうすればよいですか?
クライアントがサーバーから 3D コンテンツを取得してレンダリングする C++ クライアント/サーバー アプリケーションがあります。
私たちのクライアントはサーバーから非常に頻繁に切断され (実行の 50% 以上が 1 分未満で実行されます)、recv
失敗してWSAGetLastError
返されWSAECONNABORTED
ます。しかし、奇妙なことに、これは次の場合にのみ発生します。
- クライアントに NVIDIA Quadro GPU が搭載されている (さまざまなバージョンの Quadro を搭載した複数のマシンで発生)
- 私たちのアプリケーションはレンダリングにOpenGLを使用しています
これは、別の GPU を搭載したマシンでは見られませんでした。レンダリングを Direct3D に切り替えると、切断もなくなります。1 台の Quadro マシンで、ドライバーの更新が Windows Update を通じてプッシュされた後、この問題が発生し始めました (頻度は減りましたが、1 日に 1 回以上)。ドライバーを元に戻すことが役に立ちました。
サーバーも で失敗しrecv
ますWSAECONNRESET
。この回答によると、サーバー側で間違ったことをしています。実際に行ってshutdown
からすぐにclose
. しかし、サーバーが取得WSAECONNRESET
されるため、クライアントが最初に強制的に切断されるため、サーバーが不適切なクローズを行うことによって問題が発生することはありません。
長期的にはおそらくサーバーと問題を修正しますshutdown
が、Quadros での動作に関する短期的な回避策または説明が必要です。close
非常に風変わりに聞こえますが、Winsock と相互作用するのはドライバーのバグかもしれません。
サーバーWSAECONNRESET
がクライアントが最初に切断されたことを意味するのは正しいですか?
GPU ドライバーがソケットに引き起こす潜在的な奇妙なバグをトラブルシューティングする方法についてのアイデアはありますか? もちろん、私たちの奇妙な問題に特定の解決策があるとは思っていませんが、どんなアイデアでも解決できます。