本番環境の Cloudera Manager (4.7) ノードが故障したため、そのノードに新しい OS をインストールしました。(埋め込まれた) postgresql db のバックアップから Cloudera Manager を回復しようとしています。復元された DB を使用して、CM が既存の構成で既存のクラスターを管理できることを願っています。
私たちはいくつかの POC を行っており、以下に概説する手順で Cloudera Manager を新しいサーバーに移植しようとしています。(最終的には同じノードに CM をインストールします)
- cloudera-server-daemons をインストールする cloudera-server
- cloudera-server-db をインストールします
- sudo service cloudera-server-db start => これにより、基本的なロールが作成されます。パスワードなどを再生成します。
- そのため、pg_dumpall foo.sql から、ロールとパスワード、およびデータベースを作成した最初のステートメントを削除しました。
pql -U cloudera-scm -h localhost -p 7432 -f foo.sql postgres
.これは正常に完了しました。 - クラスター内の各ノードで、/etc/cloudera-scm-agent/config.ini を変更して、新しいノードを指すようにします。
- sudo サービス cloudera-server start . => CM が構成を取得してロードすることを期待していました。ただし、インストーラーページが表示されます
- 無料版をインストールします。ips を検索するか、使用可能なホストが表示されます。
- 次に、クラスター内の各ノードで cdh パッケージを更新し、サービスのインストールを要求します。
- この後のプロセスは少し不明確です。ただし、ロールを適切なノードに割り当てることはできました。フォーマットされていない同じルートディレクトリを使用するHDFSで、すべて問題ないようです。ただし、構成がすべて欠落しています。これは、CM が復元された DB を読み取らなかったことを示唆しているようです。
上記の手順は、cloudera マネージャーの状態を復元する正しい方法ではないようです。このリファレンスには、これを行うためのシームレスな方法がリストされている可能性があります。リンクに記載されている手順に従っても、復元された DB を CM に読み取らせることはできません。誰かが正しい手順を教えてください。どんな助けでも感謝します。