openmp - OpenMP プログラミングモデルを使用した GPU の動的/ネストされた並列処理

Question

質問は、OpenMP のターゲット構造の宣言とGPU の動的/ネストされた並列処理機能に関連しています。OpenACC 2.0 は、2 つの方法で動的並列処理をサポートします。ルーチンディレクティブと並列/カーネルディレクティブをネストされた方法で使用します。ただし、ターゲット、チーム、配布などのネストされたデバイスディレクティブの使用は、OpenMP では禁止されています。しかし、ターゲットディレクティブの宣言は、OpenACC のルーチンディレクティブと似ているように思えます。

ただし、セマンティックとその使用法はまだ明確ではありません。私のサンプルコードはこんな感じです。

#pragma omp declare target
void foo(){

  //work-1

#pragma omp target teams distribute parallel for 
for(...)
{
    if(...){
       foo();
    {
      //work-2
    }
}

//work-3
}
#pragma omp end declare target

int main(){
//work 

foo();

}

その例では、関数 foo がデバイス関数としてマップされることを期待しています。しかし、内部にターゲット構造があるため、コンパイラはこのコードを何らかの方法で変換します。私の質問はここにあります。スレッドがターゲットコンストラクト内で foo 関数の呼び出しに遭遇するとどうなりますか?

score 1 · Accepted Answer

現在、OpenMP はターゲット領域のネストをサポートしていません。したがって、コードはおそらくコンパイルされません。または、ネストされたターゲットコンストラクトが検出されたときに、実行時にクラッシュする可能性があります。または予期しない結果を生成します。基本的に不適合プログラムの結果は規定されていません。

openmp - OpenMP プログラミング モデルを使用した GPU の動的/ネストされた並列処理

1 に答える 1

Related

Reference

openmp - OpenMP プログラミングモデルを使用した GPU の動的/ネストされた並列処理