1. ホーム
  2. c++

[解決済み] OpenMP: 実行中のスレッド数の合計を取得する

2022-03-04 03:24:54

質問

私のアプリケーションがOpenMP経由で生成したスレッドの総数を知る必要があります。残念ながら omp_get_num_threads() 関数は ない は、現在のチームのスレッド数しか出力しないので、ここで動作します。

しかし、私のコードは再帰的に実行され(基本的に分割統治)、アイドルプロセッサがまだある限り新しいスレッドを生成したいのですが、それ以上ではありません。

の制限を回避する方法はありますか? omp_get_num_threads を取得し 合計 のスレッド数ですか?

もっと詳細が必要な場合は、私のワークフローをかなり忠実にモデル化した次の疑似コードを考えてみてください。

function divide_and_conquer(Job job, int total_num_threads):
  if job.is_leaf(): # Recurrence base case.
    job.process()
    return

  left, right = job.divide()

  current_num_threads = omp_get_num_threads()
  if current_num_threads < total_num_threads: # (1)
    #pragma omp parallel num_threads(2)
      #pragma omp section
        divide_and_conquer(left, total_num_threads)
      #pragma omp section
        divide_and_conquer(right, total_num_threads)

  else:
    divide_and_conquer(left, total_num_threads)
    divide_and_conquer(right, total_num_threads)

  job = merge(left, right)

このコードを total_num_threads の値が4である場合、条件文のアノテーションは (1) 常に と評価されます。 true (各スレッドチームは最大で2つのスレッドを含むため) したがって、コードは常に2つの新しいスレッドを生成し、より高いレベルですでに実行されているスレッドの数に関係なく。

を検索しています。 プラットフォーム非依存 私のアプリケーションで現在実行されているスレッドの総数を決定する方法です。

どのように解決するのですか?

作成されたスレッドの正確な量を知ることを念頭に置いて、私が思いついた最も簡単な解決策は、自分自身のスレッドカウンターを保持することです。

OpenMPについては、実際に使ったことがないので、全く無知であることを自覚してください。