これは実際にはバイオインフォマティクスの問題ですが、できる限り一般的なものにします。半仮説的な状況は次のとおりです。
クラスターやクラウドにさえアクセスできるとしましょう。このクラスター/クラウドでいくつかの非常に特定のプログラムを実行したいと考えています (正確には、ゲノム/トランスクリプトーム アセンブリ プログラム)。問題は、これらのプログラム (Velvet/Oases、Trinity など) が大量の RAM (控えめに言っても 100 GB 以上) を必要とし、クラスター/クラウドの最大ノードが 32 GB しかないと予想していることです。
MPI/Hadoop ベースのプログラム (ABySS など) に切り替えるか、独自のプログラムを作成するか、新しいコンピューターを購入する以外に、実行可能なオプションは何ですか? クラスター/クラウドの複数のノードで共有メモリを使用して分散オペレーティング システム (MOSIX、Kerrighed など) を使用しようとした人はいますか? 仮想 SMP はどうですか? ほかに何か?
助けてくれてありがとう!
明確化のために編集: 上記のプログラム (Velvet/Oases および Trinity) には、大きな RAM プールを備えた単一のシステムが必要であるとしましょう。一言で言えば、単一のプロセスが単一のシステムのようにすべてのノードからすべての RAM にアクセスできる 1 つの仮想スーパーノードに多数のノードをまとめて「貼り付ける」実行可能な方法を探しています。このようなものはおそらくパフォーマンスにかなりの影響を与えることを知っていますが、必ずしも効率的ではない可能性のあるものを探しています。
ps私の用語が混乱を招いている場合は申し訳ありません。私はこれの多くに少し慣れていません。