現在、アルゴリズムを 2 つの GPU に移植しています。ハードウェアには次の設定があります。
- NUMA システムとして 2 つの CPU を使用するため、メイン メモリは両方の NUMA ノードに分割されます。
- 各 GPU は、GPU の 1 つに物理的に接続されています。(各 PCIe コントローラーには 1 つの GPU があります)
GPU を制御するために、ホスト上に 2 つのスレッドを作成しました。スレッドはそれぞれ NUMA ノードにバインドされます。つまり、両方のスレッドのそれぞれが 1 つの CPU ソケットで実行されます。を使用して直接接続された GPU を選択できるように、GPU の数を決定するにはどうすればよいcudaSetDevice()
ですか?