私が現在調査員のために実行している科学計算プロジェクト (たまたま、ここで説明されている確率的トラクトグラフィー法である可能性があります) は、50 ノードのクラスターで 4 か月かかると聞いて、調査員は私に他のオプションを検討するように依頼しました。このプロジェクトは現在、並列 python を使用して、4 次元配列のチャンクを異なるクラスター ノードにファーム アウトし、処理されたチャンクを元に戻しています。
私が現在取り組んでいるジョブは、おそらく粗すぎる可能性があります (5 秒から 10 分、並列 Python でタイムアウトのデフォルトを増やす必要がありました)。書き直すことで、プロセスを 2 倍から 4 倍高速化できると推定しています。リソースをより有効に活用するため (データを分割して元に戻すには時間がかかりすぎるため、これも並列化する必要があります)。ほとんどの作業は、numpy 配列によって行われます。
2 ~ 4 回では不十分であると仮定して、ローカル ハードウェアからコードを取り出すことにしました。このような高スループット コンピューティングの場合、商用オプションは何ですか? また、コードをどのように変更する必要がありますか?