問題タブ [nvidia]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
cuda - デバイス メモリに割り当てられた CUDA グローバル (C のような) 動的配列
そのため、Nvidia の CUDA アーキテクチャを利用するコードを書き込もうとしています。デバイスとの間でコピーを行うと、全体的なパフォーマンスが大幅に低下することに気付きました。そのため、現在、大量のデータをデバイスに移動しようとしています。
このデータは多くの機能で使用されるため、グローバル化してほしいと考えています。はい、ポインターを渡すことができますが、この場合にグローバルを操作する方法を知りたいです。
そのため、デバイスに割り当てられた配列にアクセスしたいデバイス関数があります。
理想的には、次のようなことができます。
ただし、動的配列を作成する方法がわかりません。次のように配列を宣言することで、回避策を見つけました。
それには cudaMalloc 呼び出しは必要ありませんが、私は動的割り当てアプローチを好みます。
.net - 私の2つの画面の1つでDataGridViewの恐ろしい再描画パフォーマンス
私は実際にこれを解決しましたが、後世のために投稿しています。
デュアル モニター システムの DataGridView で非常に奇妙な問題が発生しました。この問題は、コントロールの再描画が非常に遅い (完全な再描画の場合は 30 秒など) として現れますが、画面の 1 つにある場合のみです。一方、再描画速度は問題ありません。
最新の非ベータ ドライバー (175 など) を搭載した Nvidia 8800 GT を使用しています。ドライバーのバグですか?私はこの特定の構成で生活しなければならないので、それは空中に置いておきます。(ただし、ATI カードでは発生しません...)
描画速度はセルの内容とは関係がなく、カスタム描画を行ってもパフォーマンスはまったく向上しません。塗りつぶされた四角形を描画する場合でも同様です。
後で、ElementHost (System.Windows.Forms.Integration 名前空間から) をフォームに配置すると問題が解決することがわかりました。いじる必要はありません。DataGridView もオンになっているフォームの子である必要があります。Visibleプロパティが true である限り、サイズを (0, 0) に変更できます。
アプリケーションに .NET 3/3.5 依存関係を明示的に追加したくありません。リフレクションを使用して、(可能であれば) 実行時にこのコントロールを作成するメソッドを作成します。それは機能し、少なくとも、必要なライブラリを持たないマシンでは正常に失敗します-単に遅くなるだけです.
このメソッドを使用すると、アプリの実行中に修正を適用することもできるため、(Spy++ を使用して) フォームで WPF ライブラリがどのように変更されているかを簡単に確認できます。
試行錯誤を繰り返した結果、(フォームだけではなく) コントロール自体でダブル バッファリングを有効にすると、問題が解決することがわかりました。
そのため、DoubleBuffering を有効にできるように、DataGridView に基づいてカスタム クラスを作成するだけで済みます。それでおしまい!
グリッドのすべてのインスタンスがこのカスタム バージョンを使用している限り、すべて問題ありません。これが原因でサブクラス ソリューションを使用できない状況に遭遇した場合 (コードがない場合)、そのコントロールをフォームに挿入しようとすることができると思います :) (リフレクションを使用して DoubleBuffered プロパティを外部から強制的にオンにして、依存関係をもう一度回避しようとする可能性が高くなります)。
そんな些細なことで、こんなにも多くの時間を奪われてしまうのは悲しいことです...
memory - CUDAでの定数メモリの動的割り当て
コンスタントメモリを利用しようとしていますが、配列をネストする方法を理解するのに苦労しています。私が持っているのは、内部データのカウントを持つデータの配列ですが、それらはエントリごとに異なります。したがって、次の簡略化されたコードに基づいて、2つの問題があります。まず、データ構造のメンバーが指すデータを割り当てる方法がわかりません。次に、定数メモリにcudaGetSymbolAddressを使用できないため、グローバルポインタを渡すことができるかどうかわかりません(プレーンな__device__メモリでは実行できません)。
提供された助けをありがとう。:-)
graphics - nVidia SLI トリック
nVidia の SLI テクノロジを利用するために、directx グラフィックス アプリケーションを最適化しています。私は現在、彼らの「ベスト プラクティス」Web ページに記載されているテクニックのいくつかを調査していますが、これに関してあなたが持っていたアドバイスや経験を知りたいですか?
ありがとう!
performance - glGetErrorが数秒間ハングする
私はOpenGLアプリケーションを開発していますが、奇妙なことが起こっています。私がテストしているマシンには、NVidia Quadro FX 4600が搭載されており、RHEL WS 4.3 x86_64(カーネル2.6.9-34.ELsmp)を実行しています。
デバッガーを使用してアプリケーションをステップ実行しましたが、OpenGL APIから情報を受信しているOpenGL呼び出しでハングしていることに気付きました。つまり、-glGetError、glIsEnabledなどです。ハングアップするたびに、システムが応答しなくなります。 3〜4秒。
もう1つの興味深い点は、この同じコードをRHEL 4.5(カーネル2.6.9-67.ELsmp)で実行すると、完全に正常に実行されることです。同じコードがWindowsXPでも完全に実行されます。すべてのマシンはまったく同じハードウェアを使用しています。
- PNY nVidia Quadro FX4600 768mb PCI Express
- デュアルIntelXeonDPクアッドコアE53452.33hz
- 4096 MB667MHzフルバッファDDR2
- Super Micro X7DAL-EIntel5000XチップセットデュアルXeonマザーボード
- EnermaxLiberty620ワット電源
最新の64ビットドライバーにアップグレードしました:バージョン177.82、リリース日:2008年11月12日、結果はまったく同じです。
システムがこれらのOpenGL呼び出しでハングする原因が何であるかを誰かが知っていますか?
windows - 複数のビデオカードを使用したWindowsXPでのOpenGLレンダリング
WindowsXP用のOpenGLアプリケーションを開発しています。ターゲットマシンには2枚のNVIDIAGeForce9800GTビデオカードがあります。これは、アプリケーションがアナログビデオの2つのストリームを出力する必要があるために必要です。
アプリケーション自体には、ビデオカードごとに1つずつ、合計2つのOpenGLウィンドウがあります。各ビデオカードは1台のモニターに接続されています。コードに関しては、最小限のOpenGLの例に基づいています。
アプリケーションがレンダリングに両方のビデオカードを使用しているかどうかをどのように知ることができますか?
現時点では、アプリケーションがWindows XPでのみ実行されるのか、NVIDIAビデオカードでのみ実行されるのかは関係ありません。2つがどのように機能するかを知る必要があります。
c++ - 立体視(3Dステレオ)が復活していますか?
私はC++とOpenGL(医用画像の視覚化用)の立体視アプリケーションに取り組んでいます。私の理解では、この技術は約10年前にはかなり大きなニュースでしたが、それ以降は衰退しているようです。現在、多くの企業がこのテクノロジーに投資しているようです... nVidiaを含めてそれはそう思われるでしょう。
立体視は、主にnVidiaによって「3Dステレオ」としても知られています(私は思います)。
立体視を視覚化の観点から主要なテクノロジーと見なしている人はいますか?私は娯楽と専門の両方の立場で話している。
physics - PhysX ホイールの位置を取得する
NxWheelShape を使用して、車の車輪をシミュレートしています。ホイール モデルをレンダリングするときは、shape->getGlobalPose() を使用して 4x4 マトリックスを取得し、そこにホイールをレンダリングします。ただし、これにより、キャストされたレイが他のジオメトリに当たる場所ではなく、形状の位置が得られるため、車が適切に動作しても、車輪は静止しています (回転さえしません)。ホイールの位置を取得する適切な方法は何ですか?
comparison - GPU を介した大規模なパフォーマンスのための PhysX?
私は最近、シミュレーションとゲーム開発用のいくつかの物理エンジンを比較しました。無料のものもあれば、オープンソースのものもあれば、商用のものもあります (1 つは非常に商用の $$$$ です)。Havok、Ode、Newton (別名 oxNewton)、Bullet、PhysX、および一部の 3D エンジンの「生の」組み込み物理演算。
ある段階で、結論または質問に至りました: GPU 処理による驚異的なパフォーマンス (必要な場合) を利用できるのに、NVidia PhysX 以外を使用する必要があるのはなぜですか? 将来の NVidia カードでは、通常の CPU 生成手順とは別に、さらなる改善が期待できます。SDK は無料で、Linux でも利用できます。もちろん、これはベンダーロックインであり、オープンソースではありません。
あなたの意見や経験は?今すぐ開発を始めるとしたら、上記に同意しますか?
乾杯