追加のノード(ホスト)を動作中のOpenMPIアプリにホットプラグすることは可能ですか?5秒のダウンタイムすら許されない本番環境について話しています。私が興味を持っている2つのシナリオがあります:
- ブロードキャストリスナーをもう1つ追加して、計算能力を強化したいと思います。
- ノードが停止し、マスターノードがそれを適切に処理し、タスクを他の誰かに再割り当てします。システム管理者が入り、デッドノードを再起動してクラスターに接続し直します。
上記のシナリオに最適なプラットフォームに依存しないMPI実装はどれですか?ここではOpenMPIは必須ではありません。