hadoop - ディスカバリークラスターでの糸コンテナーの利用を増やすために必要な提案

Question

現在のセットアップ

10 ノードの検出クラスターがあります。
このクラスターの各ノードには 24 個のコアと 264 GB の RAM があります。バックグラウンドプロセス用にメモリと CPU を確保し、240 GB のメモリを使用する予定です。
コンテナのセットアップに関しては、各コンテナに 1 つのコアが必要な場合があるため、最大 24 個のコンテナをそれぞれ 10GB のメモリで構成できます。
通常、クラスターには 1 ～ 2 GB のメモリを備えたコンテナーがありますが、使用可能なコアが制限されているか、何か不足している可能性があります。

問題文

私たちのクラスターはデータサイエンティストやアナリストによって広く使用されているため、24 個のコンテナーだけでは十分ではありません。これにより、リソースの競合が激しくなります。
コンテナの数を増やす方法はありますか?

検討中のオプション

チームに多くの tez クエリを (個別にではなく) ファイルで実行するように依頼した場合、最大で 1 つのコンテナーを保持します。

リクエスト

ディスカバリークラスターを管理する他の方法はありますか。
コンテナのサイズを小さくする可能性はありますか。
vcore (論理的な概念であるため) を複数のコンテナーで共有できますか?

score 0 · Accepted Answer

Vcore は単なる論理ユニットであり、CGroups で YARN を使用してyarn.nodemanager.resource.percentage-physical-cpu-limit有効にしている場合を除き、CPU コアに関連するものではありません。ほとんどのタスクが CPU バウンドになることはめったにありませんが、より一般的にはネットワーク I/O バウンドです。そのため、クラスターの全体的な CPU 使用率とメモリ使用率を調べれば、無駄な (予備の) 容量に基づいてコンテナーのサイズを変更できるはずです。

多くのツールを使用して使用率を測定できますがsar、、、gangliaおよびgrafanaは明白なツールですが、Brendan Gregg のLinux パフォーマンスツールを参照して、より多くのアイデアを得ることができます。

hadoop - ディスカバリー クラスターでの糸コンテナーの利用を増やすために必要な提案

1 に答える 1

Related

Reference

hadoop - ディスカバリークラスターでの糸コンテナーの利用を増やすために必要な提案