3

現在、アルゴリズムを 2 つの GPU に移植しています。ハードウェアには次の設定があります。

  • NUMA システムとして 2 つの CPU を使用するため、メイン メモリは両方の NUMA ノードに分割されます。
  • 各 GPU は、GPU の 1 つに物理的に接続されています。(各 PCIe コントローラーには 1 つの GPU があります)

GPU を制御するために、ホスト上に 2 つのスレッドを作成しました。スレッドはそれぞれ NUMA ノードにバインドされます。つまり、両方のスレッドのそれぞれが 1 つの CPU ソケットで実行されます。を使用して直接接続された GPU を選択できるように、GPU の数を決定するにはどうすればよいcudaSetDevice()ですか?

4

2 に答える 2