Spark で開発されたデータ パイプライン用の非常に低い構成のテスト マシンがあります。2 つの CPU と 8 GB の RAM しかない AWS t2.large インスタンスを 1 つだけ使用します。
2 つの Spark ストリーミング ジョブを実行する必要があるほか、バッチ ジョブをときどきテストするためのメモリと CPU パワーを残しておく必要があります。
したがって、マスターと 1 つのワーカーが同じマシン上にあります。
いくつかの一般的な質問があります: 1) 1 人のワーカーごとにいくつのエグゼキューターを実行できますか? デフォルトが 1 であることはわかっていますが、これを変更する意味はありますか?
2) 1 つのエグゼキュータが複数のアプリケーションを実行できますか、または 1 つのエグゼキュータが 1 つのアプリケーション専用ですか?
3)これを機能させる方法、アプリケーションが構成ファイルで使用できるメモリを設定する方法、またはスパークコンテキストを作成する方法はありますか?
ありがとうございました