SunGridEngineを使用してSMP並列環境で実行するジョブがあります。このコードはよく使用されており、通常は正常に機能します。コードはプロセッサを集中的に使用するよりもメモリを大量に消費するため、ジョブ自体(送信されたスクリプトで指定)が一部しか使用しない場合でも、通常は-pe smp 12(12コア/ノード)を使用してクラスター上のノード全体を予約しますその。
SMP並列環境を要求したので、12個のスロットすべてが同じノードからのものであり、1つのスロット/コアが必要です。したがって、これはノード全体を予約する必要があります。最近まで、その目的のためにうまく機能していました。別のユーザーが、最近グリッドエンジンを使用して、同じノードでスロットを取得したジョブを送信しました。これがどのように起こったのかわかりません。Grid Engineは、要求されたスロットより少ないスロットでSMPジョブを開始しますか?そうでない場合、私の仕事がノード全体を予約することを保証するためのより良い方法はありますか?