cgroup が有効になっている場合、Mesos の細粒度モードでの Spark の動作はどうなるのだろうと思っていました。
1 つの懸念事項は次のとおりです。cgroup なしで Mesos+spark を使用すると、実際の spark エグゼキュータ プロセスが、Mesos に約束したよりも少なくとも 10% 多くのメモリを使用することが既に示されています。cgroup を有効にすると、Spark 実行プログラムが強制終了されますか?
次に、ファイルキャッシュはどのように処理されますか? Spark はファイルキャッシュに大きく依存しています。ファイルキャッシュはMesosのメモリ量に含まれていますか? おそらくそうではありませんが、これに影響を与えることができますか? たとえば、理想的には、Spark で合計 8GB を使用し、そのうちの 5GB を Java プロセスに使用する必要があります (Spark が適切に動作し、5GB を超えて拡大しないと仮定すると)。3GB はファイルキャッシュとして使用する必要があります (最大)。
cgroup はある時点で root 資格情報に依存しているため、これらのことを自分でテストするには、クラスターのシステム管理者から多くのサポート要求を受けなければならないため、誰かがこれを経験したことを願っています。他の人に尋ねずに無駄に。