slurm を使用してクラスター内の CPU 使用率を監視する方法はありますか。たとえば、200 個のノードがあり、それらすべての 200 個のノードを使用する mpi 作業を送信したとします。1 つのノードのみが使用され (実際には計算を行っている)、もう 1 つのノードは使用されていない可能性があります。200ノードの平均CPU負荷、またはすべてのCPUの現在のCPU負荷を教えてくれるオプションはありますか?
編集:BlueGeneマシン上
ありがとう。
slurm を使用してクラスター内の CPU 使用率を監視する方法はありますか。たとえば、200 個のノードがあり、それらすべての 200 個のノードを使用する mpi 作業を送信したとします。1 つのノードのみが使用され (実際には計算を行っている)、もう 1 つのノードは使用されていない可能性があります。200ノードの平均CPU負荷、またはすべてのCPUの現在のCPU負荷を教えてくれるオプションはありますか?
編集:BlueGeneマシン上
ありがとう。