問題タブ [gpgpu]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
cuda - GPUプログラミング用のグラフィックカードを推奨してください
GPU プログラミングの実験に使用するグラフィックス カードの推奨事項を探しています。私はCUDAよりもOpenCLに傾倒しています。また、手ごろな価格のカードを探しています (50 ドル以下で利用できるものはありますか?)
algorithm - CUDA 効率的なポリゴン塗りつぶしアルゴリズム
CUDAで実行できる、閉じたポリゴンを塗りつぶすための効率的な塗りつぶしアルゴリズム(例:スキャンライン塗りつぶしなど)が必要です。何か提案はありますか?
リプレイをお寄せいただきありがとうございます。
c - OpenCL または CUDA で記述されたオブジェクト検出 (車、人) の実用的なコード例はどこにありますか?
OpenCL または CUDA で記述されたオブジェクト検出 (コンピューター ビジョンの一部) のコードはどこにありますか? あらかじめご了承ください。
opencl - PowerVR SGX530 GPUデバイスにOpenCLを使用することは可能ですか?
PowerVR SGX530 GPUデバイスにOpenCLを使用することは可能ですか?DroidXスマートフォンで実行できる画像認識ソフトウェアを作成する必要があります。リンク、参考文献、引用、サンプルコードを提供していただければ幸いです。
cuda - CUDA ツールキット OpenCL SDK で開発中に OpenCL 経由で CPU をターゲットにすることはできますか?
私は GPGPU の概念の初心者であり、ここ数か月間、CUDA と OPENCL の違いについてゆっくりと自分自身を教育してきました。OpenCL 仕様により、プログラマーはコンピューティング デバイスをターゲットにできる (つまり、GPU/CPU アーキテクチャに関係なく) ことがわかりましたが、CUDA C アプローチには常に互換性のある Nvidia GPU アーキテクチャをターゲットにするため、そのような抽象化はありません。それで、CUDA 環境で Nvidia の実装を使用して OPENCL カーネルを作成しても、CPU をターゲットにできますか? 私が理解している限り、AMD Stream 環境では、OpenCL 実装でこれを行うことができます。
前もって感謝します。
cuda - VDPAU を使用した GStreamer (nVidia カードを使用した h264 アクセラレーション)
gstreamer プラグインの最新バージョンを正しく使用していないため、VDPAU を試してみたいと思います。Blender Foundation の Big Buck Bunny ムービーでテストします。このコマンドを試してみまし
gst-launch-0.10 filesrc=/home/alex/big.mp4 ! mp4mux ! vdpauh264dec ! vdpauvideopostprocess ! vdpausink
たが、mp4mux と vdph264dec をリンクできませんでした。
また、mp4mux の代わりに ffdemux_mov_mp4_m4a_3gp_3g2_mj2 を試してみましたが、gst-launch は失敗しましたが、エラー メッセージが表示されました。
NVIDIA カードの VDPAU 機能で h264 を再生するにはどうすればよいですか?
助けてくれてありがとう、私の悪い英語を許してください。
よろしく、
opencl - GPU用のOpenCL FFTライブラリ?
OpenCL を使用して GPU で実行できる一般的な FFT ライブラリはありますか? 私の知る限り、Apple の 2 乗 OpenCL FFT のサンプル コードは、利用可能な唯一のコードですか?
非 2 乗変換サイズ用のライブラリはありますか? そうでない場合、Apple OpenCL サンプルを変更するのはどのくらい簡単ですか、または難しいですか?
変換サイズが 2 のべき乗でない画像処理アプリケーションを検討しています。大量の FFT、バッチ FFT を実行する必要があります。
amazon-ec2 - EC2の新しいAmazonのクラスターGPUインスタンスでどのように体験しますか?
AmazonがEC2をリリースしました-クラスターGPUインスタンスと私はそれであなたの経験は何ですか?安定していますか?CUDAコードをデプロイする前に、新しいドライバーやSDKなどをインストールするのに多くの時間がかかりますか?
c# - HLSL 計算 - ピクセルを順番に処理しますか?
たとえば、GPU を使用してフィボナッチ数列の最初の 100 万項を計算したいとします。(これは 32 ビット データ型の精度制限を超えることを認識しています - 例として使用しただけです)
40 個のシェーダー/ストリーム プロセッサを備えた GPU と、参考書を使用してごまかすと、100 万個の項を 250,000 ストリップの 40 ブロックに分割し、各シェーダーに 2 つの開始値をシードすることができます。
単位 0: 1,1 (2,3,5,8、何とか何とかを計算)
1号機:25万期
2号機:50万期
...
可能であれば、ピクセルが順番に処理されるようにするにはどうすればよいですか? 入力テクスチャの最初の数ピクセルに値がある場合 (簡単にするために RGBA を使用)
最初の 4 項の準備が整う前に 5 項を計算しないようにするにはどうすればよいですか?
これは複数のパスで実行できることを認識していますが、値が計算されるたびに「準備完了」ビットを設定しますが、それは非常に非効率的であり、GPU でこのタイプの計算を実行する利点が失われます。
OpenCL/CUDA/etc はおそらくこれを行うための優れた方法を提供しますが、私は (私自身の教育のために) これを XNA/HLSL で動作させようとしています。
リンクや例は大歓迎です。
更新/簡素化
あるピクセルの値を使用して隣接するピクセルの値に影響を与えるシェーダーを作成することはできますか?