4 台の物理マシンを調達して、スパーク テスト クラスターをセットアップすることができました。データは cassandra に保存され、計算は spark (SQL とデータ フレーム) で行われます。開発者としてインフラストラクチャの作業をできるだけ少なくしたいので、mesos を使用することを計画しています。
ただし、私が見つけたほとんどすべてのチュートリアルは、商用の dcos インフラストラクチャを使用したメソフィアのものです。marathon を使用するように dcos cli を構成することができましたが、メソフィア サポート担当者の 1 人が、うまく動作しない可能性があると私に言いました。
Cassandra をインストールできましたが、marathon でステータスが「異常」と表示されます。Spark はそこまで到達していません。Marathon は、デプロイ タスクが失敗していることを通知しますが、長いメッセージもエラー メッセージも何も表示されません。
メソを使うのは悪い考えですか?代替手段はありますか?Cassandra と Spark を実行する方法に関する他のリソースはありますか? 本を買うのは構わない。
更新: 4 台のマシンすべてで CentOS 7 を実行しています。これらのマシンには、20 ギガを超える RAM、12 CPU、および約 1 テラバイトのディスクが搭載されています。そのうちの 1 つはマスター ノード (zookeeper と mesos マスターを実行) としてセットアップされ、残りのマシンはスレーブ/クライアントです。