タスク トラッカーは、 Hadoop YARNアーキテクチャの 3 つのコンポーネント (リソース マネージャー、アプリケーション マネージャー、およびアプリケーション マスター)に分割されています。
YARN の基本的な考え方は、リソース管理とジョブのスケジューリング/監視の機能を別々のデーモンに分割することです。アイデアは、グローバルResourceManager (RM) とアプリケーションごとの ApplicationMaster (AM) を持つことです。アプリケーションは、単一のジョブまたはジョブの DAG のいずれかです。
ResourceManagerには、 Scheduler とApplicationsManagerという 2 つの主要コンポーネントが あります。
は Scheduler
、容量、キューなどの一般的な制約に従って、実行中のさまざまなアプリケーションにリソースを割り当てる役割を果たします。スケジューラは、アプリケーションのステータスの監視や追跡を行わないという意味で、純粋なスケジューラです。
は ApplicationsManager
、ジョブの送信を受け入れ、アプリケーション固有の ApplicationMaster を実行するための最初のコンテナーをネゴシエートし、失敗時に ApplicationMaster コンテナーを再起動するためのサービスを提供します。
は per-application ApplicationMaster
、スケジューラから適切なリソース コンテナをネゴシエートし、それらのステータスを追跡し、進行状況を監視する責任があります。
ドキュメントリンクを見てください
詳細については、この SE の質問をご覧ください。
Yarn が既存のマップ削減にもたらす追加の利点は何ですか?