私のラボは Microsoft Azure からスポンサーを得たばかりで、それを活用する方法を模索しています。私は産業レベルのクラウド サービスに不慣れで、大量の用語や概念についてかなり混乱しています。要するに、ここに私のシナリオがあります:
- 複数のデータセット、別名データ並列処理で同じアルゴリズムを実験したいと考えています。
- このアルゴリズムは、Linux (ubuntu 16.04) 上の C++ で実装されています。静的リンクを使用するために最善を尽くしましたが、それでもいくつかの動的ライブラリに依存しています。ただし、これらの動的ライブラリは apt で簡単にインストールできます。
- 各データセットは構造化されています。つまり、データ (画像、その他のファイルなど) はフォルダーで整理されています。
アイデアのシステム構成は、一連の同一の VM と共有ファイル システムです。次に、スクリプトなどから「qsub」を使用してジョブを送信できます。Azure でこれを行う方法はありますか?
Batch サービスを調査しましたが、計算ノードの作成後に依存関係をインストールする際に問題が発生しました。収納にも困りました。これまでのところ、構造化されていない Blob ストレージで Batch を使用する例だけを見てきました。
私の要件を満たすことができる Azure の他のサービスはありますか?