リモートクラスターで並列ジョブを実行した経験があり、単一のローカルマシンで並列(parfor)ジョブを実行した経験がありますが、独自のクラスターを作成しようとしたことはありません。私はいくつかのラップトップ/デスクトップ/サーバーにアクセスでき(1台のサーバーを除くすべてでrootアクセス)、それらすべて(または一部)を接続してローカルクラスターを形成できるかどうか疑問に思っていました(合計で約30コアになります)。
2 に答える
1台のマシンでの作業を超えて、ライセンスタイプを並列コンピューティングツールボックスから分散コンピューティングサーバーライセンスに移動します。ライセンスは、8人以上のワーカーからクラスターで利用できます。8ワーカークラスターの定価は$6K、32ワーカーは$21Kです。詳細については、Mathworksの製品ページをご覧ください。また、ワーカーにジョブを送信するには、 ParallelComputingToolboxが必要であることに注意してください。
ワーカーライセンスを取得したら、ワーカーにジョブを配布するためにサポートされている唯一の方法は、スケジューラーを使用することです。サーバーライセンスには、いくつかの制限がある基本的なMathworksスケジューラが付属していますが、シングルユーザーまたは小グループに最適です。それを超えると、LSFなどのハイエンドスケジューラの1つを使用する必要があります。サポートされているスケジューラの完全なリストは、製品ページにあります。単一のマシンでのPCTセットアップから分散セットアップへの移行は、かなり複雑になる可能性があります。
このためのライセンス費用を支払う準備はできていますか?並列コンピューティングツールボックスライセンスの1つのコピーを使用して、ローカルクラスター(最大8つ)を使用できます。ただし、分散クラスターを使用するには、クラスター上の「ノード」(プロセッサーコア)ごとに分散コンピューティングツールボックスが必要です。私はこれを設定する方法に精通していません。私はこれらのクラスターのいくつかにアクセスできることを知っています。また、ローカルクラスターも広範囲に使用しています。このため、独自の分散クラスターを作成しないことを選択しました。また、分散クラスターが特定のタスクに対して低速であったことを示すデータもあります(この場合、多くのファイルioが発生していました)。
私はこれがあなたの質問に答えないことを知っています、考えるべきいくつかのことだけです。