1

本番環境の Cloudera Manager (4.7) ノードが故障したため、そのノードに新しい OS をインストールしました。(埋め込まれた) postgresql db のバックアップから Cloudera Manager を回復しようとしています。復元された DB を使用して、CM が既存の構成で既存のクラスターを管理できることを願っています。

私たちはいくつかの POC を行っており、以下に概説する手順で Cloudera Manager を新しいサーバーに移植しようとしています。(最終的には同じノードに CM をインストールします)

  1. cloudera-server-daemons をインストールする cloudera-server
  2. cloudera-server-db をインストールします
  3. sudo service cloudera-server-db start => これにより、基本的なロールが作成されます。パスワードなどを再生成します。
  4. そのため、pg_dumpall foo.sql から、ロールとパスワード、およびデータベースを作成した最初のステートメントを削除しました。 pql -U cloudera-scm -h localhost -p 7432 -f foo.sql postgres.これは正常に完了しました。
  5. クラスター内の各ノードで、/etc/cloudera-scm-agent/config.ini を変更して、新しいノードを指すようにします。
  6. sudo サービス cloudera-server start . => CM が構成を取得してロードすることを期待していました。ただし、インストーラーページが表示されます
  7. 無料版をインストールします。ips を検索するか、使用可能なホストが表示されます。
  8. 次に、クラスター内の各ノードで cdh パッケージを更新し、サービスのインストールを要求します。
  9. この後のプロセスは少し不明確です。ただし、ロールを適切なノードに割り当てることはできました。フォーマットされていない同じルートディレクトリを使用するHDFSで、すべて問題ないようです。ただし、構成がすべて欠落しています。これは、CM が復元された DB を読み取らなかったことを示唆しているようです。

上記の手順は、cloudera マネージャーの状態を復元する正しい方法ではないようです。このリファレンスには、これを行うためのシームレスな方法がリストされている可能性があります。リンクに記載されている手順に従っても、復元された DB を CM に読み取らせることはできません。誰かが正しい手順を教えてください。どんな助けでも感謝します。

4

1 に答える 1

1

多くの poc の後、db ダンプは役に立たないという結論に達しました。幸いなことに、postgresql 用の /data ディレクトリがありました。

再インストールには同じマシンを選択しました (したがって、/etc/cloudera-scm-agent/config.ini でホスト名と IP アドレスをいじる必要はありません)。したがって、正しい postgresql バージョン、cloudera-scm-server をインストールしました。 cloudera-scm-server-db、cloudera-scm-agent、cloudera-scm-daemons、およびそれらに関連する依存関係。

1 つの問題は、db.mgmt.properties を失ったことです。ユーザーのパスワードを変更することができました (amon、hmon、smon、nav など)。パスワードのロジックは、postgres で使用可能な md5 関数を使用した md5(yourPasswordUser) です。さらに、このパスワードの前に「md5」を追加する必要があります。

cloudera-scm-server を起動すると、すべてのサービスが表示されます。データベース接続に問題がある場合は、アクティビティ モニターなどの関連サービスにアクセスし、パスワードを yourPassword に変更します。再起動。

これはうまくいきました。サービスをインストールまたは再構成する必要はありませんでした。

于 2015-02-18T01:22:47.877 に答える