問題タブ [gpu]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
2354 参照

opengl - GPUでのテクスチャ画像処理?

特定のシーンをテクスチャにレンダリングしていて、その画像を簡単な方法で処理する必要があります。私が今これをどのように行っているかは、を使用してテクスチャを読み取りglReadPixels()、CPU で処理することです。ただし、これでは遅すぎるため、処理を GPU に移行することを考えていました。

これを行うための最も簡単な設定は、正射影でビューポート全体を占める単純な白いクワッドを表示し、画像処理ビットをフラグメント シェーダーとして書き込むことです。これにより、処理の多くのインスタンスを並行して実行できるだけでなく、処理に必要なテクスチャのピクセルにアクセスすることもできます。

これは実行可能な行動方針ですか?このように物事を行うのは一般的ですか?それを行うためのより良い方法はありますか?

0 投票する
4 に答える
5980 参照

.net - .Net で GPU を 2 番目のプロセッサとして使用するにはどうすればよいですか?

質問は本当にそれをすべて言います。コードを c++ .dll に記述して、マネージ コードから呼び出す必要がないことを願っています。

0 投票する
5 に答える
8150 参照

opengl - GPU を使用してビデオ ストリームを効率的にレンダリングおよび処理する方法は?

C++、Qt、および OpenGL を使用して、リアルタイムでビデオを操作するためのツールを開発する予定です。フレーム処理にはシェーダーを使用する必要があるため、ビデオ オーバーレイはオプションではありません。現時点では、次の一連の手順を想像しています。

  1. ビデオのデコード (CPU)
  2. 前処理 (オプション、CPU)
  3. ビデオメモリに転送 (DMA を使用する GPU)
  4. 頂点シェーダーとフラグメント シェーダー (GPU) を使用してさらに処理する
  5. レンダリング (GPU)

ここで使用できるエクステンションやテクニックを説明する一般的なアドバイスを探しています。代わりに Direct3D を使用する正当な理由はありますか?

0 投票する
8 に答える
25998 参照

cuda - CUDA アプリがタイムアウトし、数秒後に失敗します。これを回避するにはどうすればよいですか?

CUDA アプリケーションは、失敗して終了するまでの最大実行時間が 5 ~ 15 秒になる傾向があることに気付きました。CUDAアプリケーションをそれほど長く実行しないことが理想的であることは理解していますが、CUDAを使用するのが正しい選択であり、スレッドごとのシーケンシャル作業の量のためにそれを長く実行する必要があるため、この時間を延長する方法はありますか?それを回避するには?

0 投票する
6 に答える
3495 参照

apache-flex - Flash Player 10 での GPU レンダリングの検出

どうやら、Flash 10 では、GPU を使用してシェーダーを計算でき、ユーザーが互換性のある GPU を持っていない場合は、CPU にフォールバックします。問題は、CPU によるフィルターの計算が非常に遅いことです。CPU が GPU を使用できないかどうかを検出し、使用する効果を減らすとよいでしょう。GPUレンダリングを使用している場合、アクションスクリプトを使用して検出することは可能ですか?

0 投票する
3 に答える
244 参照

c - 順序なしリストからソート済みリストにいつ切り替えるか? [最適化]

ボクセルで 3D ボリュームを分解するアルゴリズムを実装する必要があります。アルゴリズムは、どの頂点が切断計画の各側にあるかを識別することから始まり、2 番目のステップでどのエッジが切断計画を横切るかを識別します。

このプロセスは、ソートされたリストの利点を利用して最適化できます。分割点を特定するのは O log(n) です。しかし、軸ごとに 1 つのソートされたリストを維持する必要があり、これは頂点とエッジに対して維持する必要があります。これは GPU で使用するために実装されるため、メモリ管理 (つまり CUDA) にもいくつかの制約があります。押し付けがましいリスト M/trees と C が課せられます。

完全な「ボクセル化」により、最終的に 4000 個のポイントと 12000 個のエッジになると予想しています。幸いなことに、これはよりスマートな戦略を使用して処理されたボクセルを取り除き、残りのボリュームをカットしてその数を最小限に抑えることで最適化できます。この場合、100 個未満のポイントと 300 個のエッジがあると予想されます。これにより、プロセスの管理がより複雑になりますが、最終的にはより効率的になります。

したがって、問題は、並べ替えられたデータ構造を使用する利点が、単純な侵入型リンクリストと比較して、労力と複雑なオーバーヘッドに見合う価値があるかどうかを判断する基準を特定するのに役立つことです。

0 投票する
2 に答える
2763 参照

gpu - GPU の使用履歴を表示するタスク マネージャーに相当するものはありますか?

タスク マネージャーを起動して CPU の使用状況を確認するのと同じ方法で、GPU の使用履歴を表示できるアプリケーションはありますか? WPF アプリケーションで GPU にどれだけの負荷をかけているかを確認できるようにしたいと考えています。

0 投票する
4 に答える
2604 参照

c++ - C++/分散システム/ネットワークでのプロジェクトに関する提案

C ++でのコーディングを含み、ネットワーク(プロトコルスタック)に関連する2〜3か月のプロジェクト(フルタイム)に取り組みたいと思います。私は自分のネットワークスタックを書くことを考えていましたが、それはそれほど面白くないようです。ネットワークパフォーマンスに関しては、分散システム/GPUにtcp/ipのようなスタックを実装するというアイデアを見つけるのは素晴らしいことです。私はこれを3時間グーグルしてきましたが、2か月を費やす価値があると思われるものは何も見つかりませんでした。netperfのようなオープンソースプロジェクトは私の範囲を超えているようです。自分のペースで取り組むことができる、比較的小さなスタンドアロンのプロジェクトが本当に欲しいです。このプロジェクトの目的は、プロジェクトでの私の自由な時間を活用し(後でオープンソースライセンスの下でリリースする可能性があります)、C ++、ネットワーク、並列プログラミング、GPU、

アイデアを見つけているときに障害にぶつかったようです(または、正確に何をすべきかについてあまり明確ではないかもしれません)。だからどんな提案も本当にありがたいです。ありがとう!

0 投票する
26 に答える
1078 参照

optimization - コードの最適化は不要になりますか?

ムーアの法則が当てはまり、CPU/GPU がますます高速になった場合、ソフトウェア (およびそれに関連してソフトウェア開発者) は、コードを最適化する必要があるほど境界を押し広げますか? それとも、あなたのコード (など) には単純な階乗解で十分でしょうか?