問題タブ [gpgpu]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
sdk - OpenCL SDKを入手するにはどうすればよいですか?
私はhttp://www.khronos.org/Webサイトを熟読していましたが、OpenCLのヘッダーのみが見つかりました(私が気にしないOpenGLではありません)。OpenCL SDKを入手するにはどうすればよいですか?
video - このGPUビデオトランスコーディングプロジェクトは実行可能ですか?
最近、GPUを使用してビデオトランスコーディングを実行したいという人から連絡がありました。彼は基本的に、広告から販売または収益を得ることができるアプリケーションを作成することを私に望んでいます。
今、彼は基本的に私に5000米ドルの支払いで何を達成できるかを教えてくれるように頼んでいます。現在、私は大学院生であり、GPUを使用した進化的アルゴリズムに基づいた最終論文で賞を受賞しました。ですから、GPGPUのプログラミングについては知っていますが(そもそも連絡を取り合ったのはそのためです)、ビデオの圧縮やトランスコーディングなどについての深い知識はありません。
ですから、少し戸惑いました。プロジェクトを希望しますが、自分を短く売りたくないし、達成不可能なことを約束したくありません。彼が競合他社(badaboom、avivo)に似た製品を望んでいることを考えると、彼らは私よりもトピックについてはるかに多くの知識を持っている人々のチームだと思います。
ですから、私の質問は、あなたが私の状況にあった場合、どのように対応するかということだと思います。プロジェクト(GPUベースのビデオトランスコーダーを作成する)は、私のようなこの分野の専門家ではなく、有能な人にとってどれほど難しいと思いますか?
前もって感謝します
ps彼はそれがクロスプラットフォームであることを望んでいます
gpgpu - 混合ベンダーのハードウェアで OpenCL を実行する
Stream 2.0 ベータ版の ATI OpenCL 実装で遊んでいます。現在のベータ版の OpenCL は、現時点では CPU のみを使用しており、次のバージョンでは GPU カーネルをサポートする予定です。仕事用マシンに ATI GPU があるため、Stream をダウンロードしました。
私は、GPU を使用することで得られる利益から大きな恩恵を受けるソフトウェアを作成しています。ただし、このソフトウェアは顧客のマシンで実行されますが、開発するハードウェアを正確に選択して最適化する余裕はありません (多くの科学計算環境のように)。私の質問は、私のアプリケーションで ATI OpenCL 実装を配布した場合、NVidia ビデオ カードなどを使用できなくなるということですか? また、NVidia OpenCL SDK を使用すると、AMD チップ上で最適に実行されることはありません (ATI/AMD リンクを考慮すると)。
言い換えれば、最終的に OpenCL の実装を提供する責任は誰にあるのでしょうか? ユーザーは、AMD CPU で最適なパフォーマンスを提供する「ドライバー」と一緒に、NVidia ビデオ カード用の OpenCL「ドライバー」をインストールできますか?
余談ですが、Khronos メッセージ ボード以外に、OpenCL の優れた/アクティブなサポート フォーラムはありますか? ATI にはボードがあり、NVidia にもボードがあると思われますが、OpenCL ユーザー/開発者コミュニティはどこでたむろしていますか? すでに一か所に統合されていますか?
parallel-processing - 複数のGPUでコレスキー分解をスケーリングする方法
ATI Stream SDKを使用してGPUで大きな線形方程式を解くために、コレスキー分解を実装しました。今度は、ますます多くのGPUの計算能力を活用したいと考えており、このコードを複数のGPUで実行したいと考えています。
現在、1台のマシンと1台のGPUがインストールされており、コレスキー分解が正しく実行されています。Nマシンで実行したいのですが、すべてに1つのGPUがインストールされています。だから私にどのように進めるべきか提案してください。
language-agnostic - GPGPU はハックですか?
私は数日前に GPGPU の作業を開始し、優れたパフォーマンスでコレスキー分解を実装することに成功し、一部の人々が「GPGPU はハックである」と言ったハイパフォーマンス コンピューティングに関する会議に出席しました。
それが何を意味するのか、なぜ彼らがハックだと言ったのか、私はまだ混乱しています. 問題をマトリックスに変換し、それに対して操作を行っているため、これはハックであるとのことでした。しかし、それでも私は混乱しています。人々はそれがハックだと思っているのでしょうか?
誰も私を助けてくれませんか、なぜ彼らはそれをハックと呼んだのですか。
parallel-processing - Ubuntu9.04のATIStreamSDK
WindowsXPSP3でATIStreamSDKを使用し、GPUに1つのアルゴリズムを実装しました。しかし今、私はMPI(メッセージを送信するため)を使用するためにUBUNTUに切り替えた複数のマシン上の複数のGPUでこのアルゴリズムをスケーリングすることに興味があります。
これをグーグルで検索しましたが、SLESとRHELにインストールするためのリファレンスを入手しましたが、UBUNTU9.04を探しています。
ありがとうGG
math - GPU での高精度演算
HLSL を使用して GPU にアルゴリズムを実装することに興味がありますが、主な懸念事項の 1 つは、可変レベルの精度が必要なことです。GPU に実装できる 64 ビット以上の精度をエミュレートする手法はありますか。
ありがとう!
cuda - CUDA:nvccのコンパイルに数分かかる理由は何でしょうか?
nvcc
私は(技術的ptxas
には)コンパイルに10分以上かかるのが好きなCUDAコードをいくつか持っています。小さくはありませんが、確かに大きくはありません。(〜5000行)。
CUDAバージョンの更新の間に遅延が発生するようですが、以前は10分ではなく1分程度しかかかりませんでした。
このオプションを使用-v
すると、次のように表示された後、スタックしているように見えました。
カーネルにはかなり大きなパラメーターリストがあり、ポインターの数が多い構造体が渡されますが、まったく同じコードがわずか数秒でコンパイルされた時点が少なくとも1つあったことは知っています。
役立つ場合は、64ビットのUbuntu9.04を実行しています。
何か案は?
compilation - LinuxでCudaをコンパイルする場合、非常に単純なMakefileはどのようになりますか
Linux で非常に基本的な hello world レベルの Cuda プログラムをコンパイルしたいと考えています。私は3つのファイルを持っています:
- カーネル: helloWorld.cu
- メインメソッド: helloWorld.cpp
- 共通ヘッダー: helloWorld.h
これを nvcc と g++ でコンパイルするための簡単な Makefile を書いてくれませんか?
ありがとう、
ガボール