Amazon EC2 で Hadoop を永続的にセットアップしようとしています。現在私がしていることは、毎朝 EC2 インスタンスを起動し、Hadoop をセットアップすることです。この面倒な手順を回避する方法はありますか? EC2 にロードできる Hadoop イメージを探していて、作業が簡単になります。
Hadoop サービスに EMR を使用できることはわかっています。しかし、ジョブフローを送信せずに EMR (hadoop) クラスターを開始する方法がわかりません。つまり、ジョブが実行されていない Hadoop クラスターが必要です。
私の最終的な目標は、 DistmapやSealなどのバイオインフォマティクス アプリケーションを実行することです。これらのアプリケーションを実行するには、多くの依存関係があります。したがって、環境をセットアップしてこれらのアプリケーションを実行するには、無料の Hadoop クラスターが必要です。私が何をしようとしているのかが明確になることを願っています。
ありがとう。