Sun Grid Engine を使用してジョブを分散するクラスター (starcluster) で、numpy を使用して同じジョブを何度も繰り返し実行しています。各ノードには 2 つのコアがあります (AWS では c3.large)。たとえば、5 つのノードがあり、それぞれに 2 つのコアがあるとします。
numpy の行列演算は、一度に複数のコアを使用できます。私が見つけたのは、SGE が 10 個のジョブを一度に送信し、各ジョブがコアを使用することです。これにより、ジョブの実行時間が長くなります。htop を見ると、各コアの 2 つのジョブがリソースをめぐって争っているように見えます。
ノードごとに 1 つのジョブを分散するように qsub に指示するにはどうすればよいですか。ジョブを送信すると、一度に実行されるのは 10 個ではなく 5 個だけですか?