1. ホーム
  2. c++

[解決済み] omp_set_num_threads() を使用してスレッド数を 2 に設定すると、omp_get_num_threads() は 1 を返します。

2022-02-09 01:25:22

質問

OpenMPを使用した以下のC/C++のコードがあります。

    int nProcessors=omp_get_max_threads();
    if(argv[4]!=NULL){
        printf("argv[4]: %s\n",argv[4]);
        nProcessors=atoi(argv[4]);
        printf("nProcessors: %d\n",nProcessors);
    }
    omp_set_num_threads(nProcessors);
    printf("omp_get_num_threads(): %d\n",omp_get_num_threads());
    exit(0);

見ての通り、コマンドラインで渡された引数に基づいて、使用するプロセッサの数を設定しようとしているのです。

しかし、次のような出力が返ってきます。

argv[4]: 2   //OK
nProcessors: 2   //OK
omp_get_num_threads(): 1   //WTF?!

なぜ omp_get_num_threads() は2を返すのか!!!!


指摘されているように、私が呼んでいるのは omp_get_num_threads() をシリアルリージョンで返します。 1 .

しかし、私は以下のような並列コードを持っています。

#pragma omp parallel for private(i,j,tid,_hash) firstprivate(firstTime) reduction(+:nChunksDetected)
    for(i=0;i<fileLen-CHUNKSIZE;i++){
        tid=omp_get_thread_num();
        printf("%d\n",tid);
        int nThreads=omp_get_num_threads();
        printf("%d\n",nThreads);
...

を出力します。

0   //tid
1   //nThreads - this should be 2!
0
1
0
1
0
1
...

解決方法は?

その omp_get_num_threads() の呼び出しは、コードのシリアルセクションで1を返します。参照 リンク

そこで、正しい値を取得するためのコードを並列に用意する必要があります。

#include <iostream>
#include <omp.h>

int main (int argc, const char * argv[])
{
    int nProcessors = omp_get_max_threads();

    std::cout<<nProcessors<<std::endl;

    omp_set_num_threads(nProcessors);

    std::cout<<omp_get_num_threads()<<std::endl;

#pragma omp parallel for 
    for(int i = 0; i < 5; i++){
        int tid = omp_get_thread_num();
        std::cout<<tid<<"\t tid"<<std::endl;
        int nThreads = omp_get_num_threads();
        std::cout<<nThreads<<"\t nThreads"<<std::endl;
    }

    exit(0);
}

このコードで生成されます。

2

1
0    tid
2    nThreads
0    tid
2    nThreads
0    tid
2    nThreads
1    tid
2    nThreads
1    tid
2    nThreads

openmp が有効になっていないか、ループが openmp で解析可能な形式になっていないようです。