問題タブ [nvidia]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
eclipse - OpenCL / CUDA構文によるEclipseのエラー/警告をオフにする方法は?
*.cl
OpenCLのエディターとしてEclipseを使用しており、ファイルがC++コードのように動作するように構文の強調表示をオンにしました。それはうまく機能しますが、私のコードはすべて構文エラーとして下線が引かれています。構文を強調表示して、ファイルに対してのみエラー/警告をオフにする方法はあり*.cl
ますか?
memory - OpenCL / CUDAのメモリアクセスタイプごとに何回のメモリレイテンシサイクルがありますか?
プログラミングガイドとベストプラクティスガイドを調べたところ、グローバルメモリアクセスには400〜600サイクルかかると記載されていました。テクスチャキャッシュ、コンスタントキャッシュ、共有メモリなどの他のメモリタイプについてはあまり見かけませんでした。レジスタのメモリレイテンシは0です。
すべてのスレッドがコンスタントキャッシュで同じアドレスを使用する場合、コンスタントキャッシュはレジスタと同じだと思います。最悪の場合、私にはよくわかりません。
共有メモリは、バンクの競合がない限り、レジスタと同じですか?ある場合、レイテンシーはどのように展開しますか?
テクスチャキャッシュはどうですか?
cuda - MD5 暗号化用の Nvidia CUDA または ATI Stream?
Nvidia GTX 470 を購入しようと思っていたところ、知らない ATI に関する統計を見ました。
ATI カードのストリームは、暗号化と復号化に必要な計算を実行するのにはるかに優れていますか?
performance - 条件ステートメントを避けるために、複数の OpenCL カーネルを作成する必要がありますか?
OpenCL には、複雑な実際のデータを操作する必要があるカーネルがあります。これを処理するために適切なコード行を呼び出す条件ステートメントを中に入れることも、2 つのカーネルを呼び出して条件ステートメントを呼び出し元のコードにプッシュすることもできます。
これは明らかに保守性に悪いですが、パフォーマンスにとって重要ですか?
graphics - Windows Phone 7 エミュレーターでハードウェア アクセラレーションを使用するにはどうすればよいですか?
256MB のメモリを搭載した NVIDIA GeForce 9400M グラフィックス カードを搭載した古い MacBook Pro で Windows Phone 7 開発ツールを実行しています (共有されているかどうかは不明です)。単純なものであっても、グラフィックハードウェアを使用していないと思います。フレームレート カウンターは常に 002 または 003 (および赤) のようなものです。
Windows Phone フォーラムのこの投稿によると、これらは要件です。
「Silverlight® アプリケーションの Windows Phone エミュレーターで GPU アクセラレーションを利用するには、WDDM 1.1 ドライバーを搭載した DirectX 10 対応カードが必要です」
DxDiag を実行すると、カードは DirectX 10 と WDDM 1.1 をサポートし、create.msdn.com から最新のツールをダウンロードして、NVIDIA から最新のドライバーをインストールしました。
これは、Windows 7 のクリーン インストールで発生しています。
ここに記載されているエラー メッセージなしで空の XNA Windows Phone ゲームを実行できたので、結局ハードウェア アクセラレーションを使用しているのかもしれませんが、通常の Silverlight のものは非常にぎくしゃくしています。
エミュレータのグラフィックスを適切な速度で実行するにはどうすればよいですか?
profiling - OpenCL カーネル (DSP ウィンドウ関数) からのプロファイリング結果について混乱している
OpenCL でウィンドウ関数カーネルを完成させました。基本的に、ウィンドウ関数は、係数のセットを別の数値のセットに 1 つずつ適用するだけです (ウィキペディアの説明の方が適切です)。ほとんどの場合、ウィンドウ係数浮動小数点配列を定数キャッシュに詰め込むことができました。
Compute Prof からの結果は、ホストからデバイスへ、およびデバイスからホストへのメモリ転送に 95% 以上の処理時間がかかることを示していると予想していました。ほとんどすべてのケースで、処理時間はわずか 80% です。私は、420 万の float 配列をボードとの間で読み書きし、通常は 100 万をはるかに下回る別の float 配列を書き込んでいます。
カーネル内に怪しいものはありますか? そもそもCPUよりもGPUで高速に実行する必要がある問題であるかどうかについての意見(私はまだこれについて100%ではありません)。私の gld_efficiency と gst_efficiency が 0.1 から 0.2 の間で変動する理由について、私は少し唖然としています。このカーネルは、G80 グローバル メモリの合体を念頭に置いて作成しました。グローバル メモリの全体的なスループットは 40 GB で問題ないようです。カーネルは非常にシンプルで、以下に掲載されています。
}
algorithm - CPU での計算のコストと GPU へのデータの送信 + 計算の実行 + データの取得のコストを計算する方法は?
CPU での計算のコストと GPU へのデータの送信 + 計算の実行 + データの取得のコストを計算する方法は?
cuda - VDPAU を使用した GStreamer (nVidia カードを使用した h264 アクセラレーション)
gstreamer プラグインの最新バージョンを正しく使用していないため、VDPAU を試してみたいと思います。Blender Foundation の Big Buck Bunny ムービーでテストします。このコマンドを試してみまし
gst-launch-0.10 filesrc=/home/alex/big.mp4 ! mp4mux ! vdpauh264dec ! vdpauvideopostprocess ! vdpausink
たが、mp4mux と vdph264dec をリンクできませんでした。
また、mp4mux の代わりに ffdemux_mov_mp4_m4a_3gp_3g2_mj2 を試してみましたが、gst-launch は失敗しましたが、エラー メッセージが表示されました。
NVIDIA カードの VDPAU 機能で h264 を再生するにはどうすればよいですか?
助けてくれてありがとう、私の悪い英語を許してください。
よろしく、
emacs - Emacs -fs(フルスクリーン)
私はまともなフォントでフルスクリーンモードでemacsを使おうとしています。Ubuntuを実行しているnvidiaベースのラップトップを持っています。それが最初にロードされるとき、フォントは巨大で、16ptフォントだと思います。メニューオプションを使用して、適切なフォント(8pt)を設定しました。
これで、emacsをフルスクリーンモードで実行すると、ウィンドウの種類が巨大なフォントに合わせて調整され、8ptフォントが読み込まれます。これで、画面の半分がミニバッファーになりました。フルスクリーンモードを使用できるようにフォントを正しく設定するにはどうすればよいですか。
x構成でdisplaysizeを指定しようとしましたが、Xが起動しません。nvidiaドライバーのために他にやらなければならないことがあると聞きましたが、それがどのように機能するかはわかりません。
opencl - 私のOpenCLカーネルが特定のパラメーターで実行されない理由で立ち往生
JOCLで実行するOpenCLカーネルがあり、すべてのJUnitテストに合格しています。同じ条件下でカーネルのプロファイルを作成できるように、コードをC++に移植しました。ドライバーは、1つを除いてすべての場合に正常に動作します。JOCLでは完全に正常に動作するので、C++コードの何かが間違っていると思います。私のコードは以下のとおりです。私はそれを監査して死にました。誰かが私が何が悪いのかを見つけるのを手伝ってくれるなら、私はそれをいただければ幸いです。
ドライバーコードは、引数1と2を8192、引数3を512として正常に機能します。また、引数1と2を512、引数3を8192として正常に動作します。引数4は常に1であり、カーネルを実数に設定します。args 1と2を262144に、arg 3を16に設定すると、実行され、エラーは報告されず、セグメンテーション違反も発生しませんが、カーネルは最終的にデータを変更しません。上記のすべての場合のarg1*3は2^22に等しいことに注意してください。すべての場合に同じ量のフロートを割り当てていると思います。私は困惑しています。OpenCLに何が悪いのか教えてもらえません:(
}