c++ - openMP-変数とアトミックへの同時アクセス

Question

ボックスをサンプリングしている関数をopenMPと並列化したいと思います（ボックス内のポイントをランダムに選択し、これらのポイントで特定の関数を評価します）。次のコードを書きました。

//storing points
double** points_ = new double*[N-m];
for(int i=0;i<N-m;i++)
{
    points_[i]=new double[ndim];
}
double* evals_ = new double[N-m];

#pragma omp parallel for 
for(int i=0;i<N-m;i++)
{
    double* pt_ = randomPoint(lower,upper);
    for(int k=0;k<ndim;k++)
    {
        points_[i][k]=pt_[k];
    }
    evals_[i]=evalFunc(pt_);
    delete pt_;
}

ただし、私はこのコードに自信がありません。evals_とpoints_はeauchスレッドで更新されます。そこにいくつかのアトミックステートメントを追加することを考えています。

#pragma omp parallel for 
for(int i=0;i<N-m;i++)
{
    double* pt_ = randomPoint(m_lower,m_upper);
    for(int k=0;k<m_ndim;k++)
    {
        #pragma omp atomic update
        points_[i][k]=pt_[k];
    }
    #pragma omp atomic update
    evals_[i]=evalFunc(pt_);
    delete pt_;
}

しかし、これは非常に非効率的であると私は恐れています。より正確に書くためのアドバイスはありますか？そして...これはコンパイルされていません...（エラー：#pragma ompアトミックに続く式は不適切な形式です）ただし、openMP仕様、A22でその例を見つけることができます

void atomic_example(float *x, float *y, int *index, int n)
{
    int i;
    #pragma omp parallel for shared(x, y, index, n)
    for (i=0; i<n; i++) {
    #pragma omp atomic update
    x[index[i]] += work1(i);
    y[i] += work2(i);
    }
}

また、アトミック更新の後には、アレイへの影響もあります。

ありがとう、よろしく。

編集 - - - -

私はチューダーの答えに同意します。ただし、この例では、別の並列化されたコードでアトミックが必要なようです。行sum _ + = ...で、エラーが発生します（同時アクセス）

for(i=0;i<m_ndim;i++)
{
    double sum_=0;
    #pragma omp parallel reduction(+:sum_)
    for(j=0;j<m_npts;j++)
    {
        sum_ += set_[j][i];
    }
    Sum_[i] = sum_;
}

なぜそれが必要なのですか？それとも他に何かが間違っていますか？

score 3 · Accepted Answer

コードにアトミック句は必要ありません。

その理由は、外側のループが index で分割されているため、各スレッドは別のスレッドの作業セットと重複しないiから要素のセットを取得するためです。points_eval_

evals_は配列であるため、各スレッドは連続したサブ配列を取得します (暗黙の静的スケジューリングスキームにより)。

0 1 2 3 . 4 5 6 7 . 8 9 10 11...
   t1        t2        t3

points_は二次元行列であり、各スレッドは連続した行のセットを取得します。

この 2 番目のケースではk、各スレッドのの範囲は同じですkが、更新されたポイントは異なる行 (インデックスi) にあるため、の値に重複があるように見えます。スレッド。

c++ - openMP-変数とアトミックへの同時アクセス

1 に答える 1

Related

Reference