問題タブ [openacc]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c - openACC カーネル内のすべての行は常に GPU で動作しますか?
カーネル構造に関連するものがあるのだろうか。カーネル内のすべての行が GPU で動作するわけではありませんか?
たとえば、私はこのコードを持っています:
また、ACCパラレル構造でも同じですか?
c - OpenACC の C/プリプロセッサ標準マクロ?
OpenMP_OPENMPでは、OpenMP モードでコンパイルするときにマクロが定義されています (ほとんどの場合、私が知っているコンパイラ (gcc、pgi、intel など) によって)。OpenACC モード (Cray/pgi/その他のコンパイラ) でコンパイルするときに、同様の「標準」マクロが定義されていますか?
ウィラワン
cuda - 共通ステートメントの代わりにモジュール内の変数
cuda fortran を使用してコードを高速化しようとしています。このコードは、cuda を使用したデバイス コードでは無効な変数の定義で common ステートメントを使用しています。
私がしたことは、共通ステートメントを使用する代わりにモジュールで変数を定義することですが、これは間違った答えになります。一般的なステートメントの代替を見つけるために、これらすべてを通常のコードで実行しています。
これらの変数はこれらの関数でのみ使用されるため、このように機能するはずですが、そうではありません。何故ですか?そして、この問題を解決するにはどうすればよいですか?
cuda - openacc と openmp & mpi の違いは?
openacc と openmp の主な違いは何だろうと思っていました。MPI、cuda、opencl はどうですか? openmp と mpi の違い、特に共有メモリと分散メモリに関する部分を理解しています ハイブリッド gpu-cpu 処理セットアップを許可するものはありますか?
fortran - より大きな規模のプログラムを実行している場合の OpenACC エラー
次のコードを使用すると、正しいですか? 私は 2GB の Geforce 750M を持っていて、PGI Fortran コンパイラを使用しています。プログラムは4000x4000配列に対して正常に動作しますが、それ以上のものは問題ありませんが、9000x9000配列が割り当てられていることがわかりますが、4000 を超える値を使用すると、エラーが発生し、ランタイム エラーがスローされます。
c - OpenACC プラグマ行内で構造体データ型を使用する
CAPS OpenACC コンパイラを使用しています。OpenACC プラグマ行の構造体データ型内で動的配列を使用しようとしました。そのような私のコード:
正常にコンパイルされました。しかし、実行しようとすると、これらのエラーが発生しました
私の質問は、構造体データ型を OpenACC と一緒に使用する方法はありますか? さらに、私のケースは、そのような構造体の構造体にも有効です: