3

次の行列乗算を行う行列乗算コードがあります。ここで、行列 A * 行列 B = 行列 C

for(j=1;j<=n;j++) {
 for(l=1;l<=k;l++) {
  for(i=1;i<=m;i++) {
   C[i][j] = C[i][j] + B[l][j]*A[i][l];

 }
}

今、私はそれをマルチスレッドの行列乗算に変えたいと思っています。私のコードは次のとおりです:

私は構造体を使用します

struct ij
{
 int rows;
 int columns;
};

私の方法は

void *MultiplyByThread(void *t)
{
 struct ij *RowsAndColumns = t;
 double total=0; 
 int pos; 
 for(pos = 1;pos<k;pos++)
 {
  fprintf(stdout, "Current Total For: %10.2f",total);
  fprintf(stdout, "%d\n\n",pos);
  total += (A[RowsAndColumns->rows][pos])*(B[pos][RowsAndColumns->columns]);
 }
 D[RowsAndColumns->rows][RowsAndColumns->columns] = total;
 pthread_exit(0);

}

そして私のメインの中にあるのは

      for(i=1;i<=m;i++) {
        for(j=1;j<=n;j++) {

   struct ij *t = (struct ij *) malloc(sizeof(struct ij));
   t->rows = i;
   t->columns = j;

    pthread_t thread;
    pthread_attr_t threadAttr;
    pthread_attr_init(&threadAttr);
    pthread_create(&thread, &threadAttr, MultiplyByThread, t);    
    pthread_join(thread, NULL);    

        }
      }

しかし、最初の行列乗算と同じ結果が得られないようです (これは正しいです) 誰かが私を正しい方向に向けることができますか?

4

2 に答える 2

2

次のことを試してください。

#pragma omp for private(i, l, j)
for(j=1;j<=n;j++) {
    for(l=1;l<=k;l++) {
        for(i=1;i<=m;i++) {
            C[i][j] = C[i][j] + B[l][j]*A[i][l];
        }
    }
}

OpenMP を有効にするために GCC コンパイラ スイッチをグーグル検索しているときに、実際にこのブログ記事に出くわしました。

OpenMP は、マルチコア マシンに最も適したコンパイラでサポートされています。詳細については、OpenMP の Web サイトを参照してください。

于 2010-11-04T17:28:47.583 に答える
0

実際、スレッドコードはスレッド化されていません。スレッドを作成し、create を呼び出した直後に join を呼び出すことでスレッドが完了するのを待ちます。mxn スレッドのマトリックスを作成し、それらをすべて起動してから、すべてを結合する必要があります。それとは別に、コードはループと同じように計算しているようです。結果との正確な不一致は何ですか?

例 (注、コンパイルされていません):

pthread_t threads[m][n]; /* Threads that will execute in parallel */

そして主に:

 for(i=1;i<=m;i++) {
    for(j=1;j<=n;j++) {

    struct ij *t = (struct ij *) malloc(sizeof(struct ij));
    t->rows = i;
    t->columns = j;

    pthread_attr_t threadAttr;
    pthread_attr_init(&threadAttr);
    pthread_create(thread[i][j], &threadAttr, MultiplyByThread, t);    
    }
  }

  /* join all the threads */
  for(i=1;i<=m;i++) {
    for(j=1;j<=n;j++) {
       pthread_join(thread[i][j], NULL);
    }
  }

(多かれ少なかれ、pthread_joinループ内の各スレッドを呼び出さないだけです)。

于 2010-11-04T16:50:59.860 に答える