如何在openmp中为每个线程分配一个特定的工作以添加矩阵

2018-06-28 08:34:59

我正在尝试创建一个矩阵加法程序来练习OpenMP。我有N ^ 2个处理器/线程，并且需要分配每个线程，以便它计算结果矩阵的一个条目。例如，如果我有两个大小为NxN的矩阵A和B，那么每个线程都应该计算结果矩阵C的一个条目。在阅读OpenMp中的一些初学者教程时，似乎#pragma omp parallel for指令将任务同样在指定的线程总数中。但在下面的代码中，只有3个线程处于活动状态，而不是我想要的。

我拥有的代码如下所示：

 #include <stdio.h>
#include "omp.h"



void  main() {

  // omp_set_num_threads(NUM_THREADS);
  int i, k;
  int N=3;

  int A[3][3] = { {1, 2, 3},{ 5, 6, 7}, {8,9,10} };
  int B[3][3] =  { {1, 2, 3},{ 5, 6, 7}, {8,9,10} };
  int C[3][3] ;

  omp_set_dynamic(0);
   omp_set_num_threads(9);
   // printf("Num of threads %i n", omp_get_max_threads());

#pragma omp parallel for private(i,k) shared(A, B, C, N)

  for (i = 0; i< N; i++) {
    for (k=0; k< N;k++){

           int j = omp_get_thread_num();

       C[i][k] = A[i][k] +  B[i][k] ;


              printf("I m thread %d computing A[%d][%d] and B[%d][%d] = %d n ", j, i,k, i,k, C[i][k]);

  }
  }


  int n, m;
  for (n=0; n<3; n++) {
    for ( m=0;m<3;m++){
      printf("C[%d][%d] = %d n",n,m, C[n][m]);   

 }


}

}

我得到的输出是：

I m thread 0 computing A[0][0] and B[0][0] = 2 
 I m thread 1 computing A[1][0] and B[1][0] = 10 
 I m thread 1 computing A[1][1] and B[1][1] = 12 
 I m thread 1 computing A[1][2] and B[1][2] = 14 
 I m thread 0 computing A[0][1] and B[0][1] = 4 
 I m thread 0 computing A[0][2] and B[0][2] = 6 
 I m thread 2 computing A[2][0] and B[2][0] = 16 
 I m thread 2 computing A[2][1] and B[2][1] = 18 
 I m thread 2 computing A[2][2] and B[2][2] = 20 
 C[0][0] = 2 
C[0][1] = 4 
C[0][2] = 6 
C[1][0] = 10 
C[1][1] = 12 
C[1][2] = 14 
C[2][0] = 16 
C[2][1] = 18 
C[2][2] = 20

我想要的是，九个线程中的每一个都计算矩阵C的一个条目。任何人都可以请求帮助。我是C和OpenMP的新手。我也对私有变量中私有变量的确切功能感到困惑。例如，如果我将'i'和'k'指定为私有，那么这是否意味着每个线程都会有'i'和'k'的副本，因此可能会运行它们自己的循环迭代？但是这没有意义，因为在上面的输出中，线程0计算所有的行0值，并且线程1计算所有行1的值。这是怎么发生的，没有任何具体的指令？感谢您的帮助！

在外部for循环中使用#pragma omp parallel for ，它仅应用于仅迭代3次（ N = 3 ）的外部循环，因此您只需要3个线程。

如果你想使用9个线程，你应该使用一个索引折叠2d数组为1d，我们称之为p ：

#pragma omp parallel for private(i, k, p) shared(A, B, C, N)
for (p = 0; p < N * N; p++) {
    i = p / N;
    k = p % N;
    C[i][k] = A[i][k] + B[i][k];
}

正如George的回答和Timothy的评论所述，您还可以使用OpenMP的collapse(2)关键字来实现相同的目的。

另一种方式，如果你想保留2个循环，除了'chrk'的回答外，就是使用：

#pragma omp parallel for private(i,k) shared(A, B, C, N) collapse(2)

像这样，你将在两个循环中并行执行。因为，现在，你只有在外部循环中并行执行。这就是为什么你看到例如线程1计算所有行1的值。

链接地址: http://www.djcxy.com/p/79221.html

上一篇: How to assign a specific job to each thread for matrix addition in openmp

下一篇: omp use in ubuntu c++