0

私は他の 4 人と Kaggle のコンテストに参加しています。私たちは皆、edx.org による MOOC で会いました。

Apache Spark エンジンを使用してコーディングすることはできますが、クラスターをセットアップし、クラスターで Spark を実行するために必要なソフトウェアをインストールする方法はわかりません。

理想的には、プログラミングに集中できる無料のプラットフォームを探しています。

使いやすく、理想的には無料のプラットフォームを知っていますか? ない場合は、チャレンジに参加するために必要なインフラストラクチャをセットアップする方法を教えていただけますか?

事前にどうもありがとうございました。

4

1 に答える 1

2

バンドルされたスクリプトを使用して Linux または OS X でスタンドアロン クラスターを開始することはそれほど難しくありません。1 つのノードで作業するか、それぞれの開発用コンピューターを (同じ LAN 上の) クラスターに提供できる場合は、これで十分です。

スケーリングが必要な場合、AWS EMRは非常にシンプルです。

もう少しお金を払えば、Databricksはマネージド サービスとして Spark を提供します。つまり、クラスターの実行についてあまり考える必要はありません。

于 2015-08-04T00:16:15.273 に答える