問題タブ [opencl]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
compiler-construction - Mac OS X 10.6.3 で Open CL をコンパイルするにはどうすればよいですか?
指示に従って CUDA 3.0 をコンパイルできましたが、それに対応する OpenCL を Mac OS X 10.6.3 でコンパイルできませんか?
performance - ディスプレイ GPU で OpenCL を使用する場合、GUI の応答性を確保するにはどうすればよいですか?
OpenCL を学習するのに比較的短い時間でしたが、アプリケーションが原因でオペレーティング システムの UI の応答が大幅に低下するのを頻繁に目にします (たとえば、ウィンドウがドラッグに応答するのに数秒かかります)。この問題は、NVidia GPU を搭載した Windows Vista と Mac OS X で発生しました。
ディスプレイと同じ GPU で OpenCL を使用する場合、アプリケーションがこのように UI の応答性を大幅に低下させないようにするにはどうすればよいですか? また、アプリケーション内で不必要にパフォーマンスを低下させることなく、これを行うことはできますか? (つまり、ユーザーが UI を集中的に使用するタスクを実行していない場合、アプリケーションの実行速度が現在より遅くなるとは思わないでしょう。)
回答はプラットフォーム固有のものであることを理解しています (プラットフォームには OS/GPU/ドライバーの組み合わせが含まれます)。
opencl - Nvidia GTX 295 の OpenCL サポート
Nvidia GTX 295 の OpenCL サポートは Linux に存在しますか、それとも近い将来に予定されていますか?
concurrency - OpenCL は同じメモリアドレスへの同時書き込みを許可しますか?
2 つ (またはそれ以上) の異なるスレッドが OpenCL のグローバル空間の同じメモリ位置に書き込むことは許可されていますか? 書き込みは常に uchar を 0 から 1 に変更するため、結果は予測可能ですが、プログラムで不規則な結果が得られるため、一部の書き込みが失敗したことが原因ではないかと考えています。
バッファーを書き込み専用として宣言し、後で読み取り専用バッファーにコピーすることはできますか?
scientific-computing - OpenCLからどのような仕事のメリットがありますか
初めに:
- 私はOpenCLが魔法のようにすべてを速くするわけではないことをよく知っています
- OpenCLには制限があることをよく知っています
さて、私の質問ですが、私はプログラミングを使用してさまざまな科学計算を行うことに慣れています。私が扱っていることのいくつかは、計算の複雑さと数に関してかなり激しいものです。だから私は疑問に思っていました、多分私はOpenCLを使って物事をスピードアップすることができます。
ですから、皆さんからお聞きしたいのは、次の[リンクのボーナス]のいくつかに対する回答です。
*OpenCLにはどのような計算/アルゴリズム/一般的な問題が適していますか
*特定のコードがOpenCLへの移行によって利益を得るかどうかを判断するための一般的なガイドラインは何ですか?
よろしく
cuda - GPUプログラミングのためのDirectCompute対OpenCL?
GPUコンピューティングにうまく対応する必要のある(財務上の)タスクがいくつかありますが、OpenCLとDirectComputeのどちらを使用すべきかはよくわかりません。私はGPUコンピューティングをいくつか行いましたが、それはずっと前(3年)でした。当時は実際には代替手段がなかったので、OpenGLを介してそれを行いました。
私はいくつかのOpenCLプレゼンテーションを見てきましたが、それは本当に素晴らしく見えます。DirectComputeについてはまだ何も見ていませんが、それも良いと思います。
現時点では、クロスプラットフォームの互換性には関心がありません。さらに、2つのモデルは、一方から他方に移動しようとしたときに大きな頭痛の種を引き起こさない程度に類似していると思います。
それで、あなたはこれらの2つのいずれかを使用しましたか?特にDirectCompute?OpenCL(およびCUDA)と比較してどうですか?
c - OpenCL ユーザー定義インライン関数
カーネルが呼び出すことができるように、OpenCL コードで独自の関数を定義することはできますか? はい、簡単な例をどこで見ることができますか?
opengl - OpenCL または OpenGL – どちらを使用しますか?
私の問題には、中央に黒い領域がある白黒の画像が含まれます。これまで OpenGL または OpenCL を使用したことがないため、どちらを選択すればよいかわかりません。その領域に白い円をいくつか置き、最後に画像全体が白いかどうかを確認したい. いろいろ組み合わせてみますので、並列性があるGPUを使いたいです。
OpenGL を使用して円をテクスチャとして作成し、画像の上に配置する必要がありますか、それともマトリックスのピクセル/エントリで動作する OpenCL カーネルを作成する必要がありますか?
opencl - OpenCLでのマトリックス反転
OpenCLを使用していくつかの計算を高速化しようとしていますが、アルゴリズムの一部は行列の反転で構成されています。OpenCLまたはCUDAで記述された行列または一般的な反転のlu分解(lapack dgetrfおよびdgetri)を計算するためのオープンソースライブラリまたは無料で利用可能なコードはありますか?マトリックスは実数で正方形ですが、それ以外に特別なプロパティはありません。これまでのところ、GPUでの基本的なblas行列-ベクトル演算の実装のみを見つけることができました。
マトリックスはかなり小さく、約60〜100行と列しかないため、CPUでより高速に計算できますが、アルゴリズムの途中で使用されるため、ホストに転送し、逆数を計算する必要があります。次に、結果をデバイスに転送して戻し、そこではるかに大規模な計算で使用されます。
python - Pythonのみを使用してNvidiaのCUDAをプログラムできますか、それともCを学ぶ必要がありますか?
質問はそれ自体を物語っていると思います。私はいくつかの深刻な計算を行うことに興味がありますが、貿易によるプログラマーではありません。私は自分がやりたいことを成し遂げるのに十分なPythonをつなぎ合わせることができます。しかし、Pythonでプログラムを作成し、GPUにCUDAを使用して実行させることはできますか?または、PythonとCを組み合わせて使用する必要がありますか?
Klockner(sp)の「pyCUDA」Webページの例には、PythonとCの両方が混在していたため、答えがわかりません。
誰かがOpenclについてチャイムを鳴らしたい場合は、お気軽に。ほんの数週間前にこのCUDAビジネスについて聞いたのですが、このようなビデオカードを使用できるとは知りませんでした。