問題タブ [gpu]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
opengl - GPU 手動ミップマップ生成 [OpenGL 2.x]
特定のカスタマイズされたアルゴリズムを使用して、一部のレンダリング可能なテクスチャ (R16F & RGBA16F) のミップマップを生成したいと考えています。
必要なすべてのテクスチャのミップマップは、glGenerateMipmapEXT() を使用して事前に有効化されています。
これまでの最大の問題は、1+ ミップマップ レベルにレンダリングすることです。 より正確には、これは魅力のように機能します。
しかし、これにより、fboステータスを確認するときにGL_FRAMEBUFFER_INCOMPLETE_ATTACHMENT_EXTが表示されます
コードのすべての違いは、テクスチャを FBO にアタッチするためのロッド レベル パラメータです。
熱狂的な頭をひっかいた後も、まだうまくいきません。ですから、どんな答えでも大歓迎です。
[注: ターゲット プラットフォームは、FBO 拡張機能を備えた OpenGL 2.x です]
build-automation - cmakeからcuda対応GPUの存在をテストする最も簡単な方法は?
cudaライブラリがインストールされているが、cuda対応のGPUがインストールされていないナイトリービルドマシンがいくつかあります。これらのマシンは、cuda対応のプログラムを構築できますが、これらのプログラムを実行することはできません。
自動化された夜間ビルドプロセスでは、cmakeスクリプトはcmakeコマンドを使用します
find_package(CUDA)
cudaソフトウェアがインストールされているかどうかを確認します。CUDA_FOUND
これにより、 cudaソフトウェアがインストールされているプラットフォームにcmake変数が設定されます。これは素晴らしく、完璧に機能します。が設定されている場合CUDA_FOUND
、cuda対応プログラムをビルドしても問題ありません。マシンにcuda対応のGPUがない場合でも。
しかし、cudaを使用するテストプログラムは、GPU以外のcudaマシンでは当然失敗し、夜間のダッシュボードが「ダーティ」に見える原因になります。だから私はcmakeがそのようなマシンでそれらのテストを実行するのを避けたいです。しかし、私はまだそれらのマシンでcudaソフトウェアを構築したいと思っています。
肯定的なCUDA_FOUND
結果が得られたら、実際のGPUの存在をテストし、CUDA_GPU_FOUND
これを反映するように変数を設定します。
cmakeにcuda対応のGPUの存在をテストさせる最も簡単な方法は何ですか?
これは、MSVCを搭載したWindows、Mac、およびLinuxの3つのプラットフォームで機能する必要があります。(それが私たちが最初にcmakeを使用する理由です)
編集: GPUの存在をテストするプログラムを作成する方法についての回答には、見栄えの良い提案がいくつかあります。まだ欠けているのは、CMakeに構成時にこのプログラムをコンパイルして実行させる手段です。ここではCMakeのTRY_RUN
コマンドが重要になると思いますが、残念ながらそのコマンドはほとんど文書化されておらず、どのように機能させるかがわかりません。問題のこのCMakeの部分は、はるかに難しい質問かもしれません。おそらく私はこれを2つの別々の質問として尋ねるべきでした...
cuda - より良いパフォーマンスを得るためにcudaプログラムを最適化する方法は?
キーを生成するためのmatlabプログラム(cuda)を作成します。
より良いパフォーマンスを得るためにcudaプログラムを最適化する方法は?
opengl - 最新の GPU で古い学校の 2d ブリッティングを行うことは可能ですか?
GL はすべてのゲーム プラットフォーム (ハンドヘルドも含む) の主流になっているようです。これにより、最新の GPU チップセットを多数の消費者に展開することが求められています。
これは素晴らしいです。
現在出回っている最新の GPU システムでは、一般的な旧式のグラフィックス プログラミング (別名 - VRAM を使用した X rect から Y rect へのブリット) を実行できますか? (Amiga を考えてみてください) それとも、操作は頂点シェーダーとピクセル シェーダーを中心にしているのでしょうか?
これは GL からアクセスできますか? OpenGLES?
テクスチャ付きクワッドのレンダリングは問題ありませんが、ダブル バッファリングとシーン全体の再レンダリングが必要になります。これを回避できるかどうかを見ていました。
opengl - ハードウェアを介した OpenGL での 2D エンジンのスクロール?
2D タイル エンジンのボトム エンドとして OpenGL を使用しています。すべてが 2D の場合、特定の問題を最適化するのは簡単です。たとえば、スクロール。画面の特定のセクションを下からスクロールする必要があることがわかっている場合は、その部分をブリットするだけです。一度に1ピクセル以上移動しています。明示的なハードウェア サポート (古いニンテンドー ハードウェアを考えてください) がなければ、これには多くのピクセル書き込みが必要です。オンチップ bitblt は次善の策です。
基本的に、効率的なハードウェア ブリットとして VRAM テクスチャ レンダーを使用するために GL 呼び出しを最適化する方法を検討しています。
GL にフレームバッファをスクロールさせることは可能ですか、それとも、フレームごとにシーン全体をダブルバッファリングして再レンダリングすることをやめるべきですか?
どうも
gpu - 科学計算にはどのプラットフォームを選択すればよいですか?
GPU を犠牲にして科学計算のプラットフォームとして PS3 を選択することの長所と短所は何ですか? それはより良い選択ですか?
benchmarking - GPUプログラミング-転送のボトルネック
GPUに計算を行わせたいので、「テクスチャ」のアップロードとダウンロードの速度を測定するトピックに興味があります。「テクスチャ」はGPUが処理する必要のあるデータだからです。
メインメモリからGPUメモリへの転送が好ましい方法であることを私は知っているので、処理するデータが多く、結果がほとんど読み戻されない場合にのみ、このようなアプリケーションが効率的であると期待しています。
とにかく、そのようなベンチマークアプリケーションはありますか?つまり、メインメモリ<>GPU転送スループットを測定するために...
編集(質問の明確化):
あなたが始めたアプリケーションがあったら、それは2つの数字を出しました:
メインメモリとグラフィックカードメモリ間のmb/s転送速度、メインTOグラフから、テクスチャアップロード
メインメモリとグラフィックカードメモリ間のmb/s転送速度、グラフからメイン、テクスチャダウンロード
もう一度、それを手に入れたいと思います。
まだ別の編集(何かを見つけた):
ここでhttp://www.benchmarkhq.ru/english.html?/be_mm.html(TexBenchを検索)は、スループットを一方向で測定するアプリです...
cuda - Cuda GPU の最適化
CPU の代わりに NVIDIA GPU を使用すると、特定の問題で 100 倍の加速があったことを読みました。
さまざまな問題で cuda を使用した最適なパフォーマンス アクセラレーションのタイミングは何ですか。
可能であれば、問題と加速係数を論文へのリンクとともに記載してください。
cuda - GPU 上のグラフ アルゴリズム
現在の GPU 実行とメモリ モデルは何らかの制限があります (メモリ制限、データ構造の制限、再帰なし...)。
グラフ理論の問題を GPU で実装することは実現可能だと思いますか? 例えば頂点カバー?支配セット?独立セット?マックスクリーク?...
GPU で分岐限定アルゴリズムを使用することも可能ですか? 再帰的バックトラック?
simulation - GPU に移植する価値のある物理オープンソース シミュレーション手法はどれか
私はレポートを書いていますが、オープンソースの物理シミュレーション手法 (分子動力学、ブラウン動力学など) のうち、まだ移植されていないもののうち、GPU やその他の特別なハードウェアに移植する価値があるものをあなたの意見で知りたいと思います。計算を高速化できる可能性があります。
プロジェクトへのリンクは本当にありがたいです。
前もって感謝します