非 VM セットアップでハートビートと仮想 IP メカニズムを使用して、このセットアップを既に構成しています。
Hadoop 1.0.3 を使用しており、Namenode メタデータの共有に共有ディレクトリを使用しています。問題は、Amazon クラウドでは、Linux-ha を使用して高可用性を実現するための仮想 IP のようなものがないことです。
誰もがこれを達成できましたか。必要な手順を教えてください。
非 VM セットアップでハートビートと仮想 IP メカニズムを使用して、このセットアップを既に構成しています。
Hadoop 1.0.3 を使用しており、Namenode メタデータの共有に共有ディレクトリを使用しています。問題は、Amazon クラウドでは、Linux-ha を使用して高可用性を実現するための仮想 IP のようなものがないことです。
誰もがこれを達成できましたか。必要な手順を教えてください。
今のところ、hbase で Hbase レプリケーション WAL を使用しています。0.92 以降の Hbase がこれをサポートしています。
クラウド上の Hadoop クラスタリングについては、2.0 リリースが安定するまで待ちます。
以下を使用しました
クライアント側では、ネットワークが中断した場合に再接続するために代わりに使用される 2 つのマスター サーバーを持つロジックを追加しました。
これは、相互にバックアップする単純な 2 台のマシンで機能しましたが、サーバーの数が多い場合はお勧めしません。
それが役に立てば幸い。
Hadoop を高可用性にするためには、2 つの部分があります。最初の、そしてより重要なのは、もちろん NameNode です。起動して構成できるセカンダリ/チェックポイント NameNode があります。これにより、プライマリ NameNode がダウンした場合でも、HDFS を稼働させ続けることができます。次は、すべてのジョブを実行する JobTracker です。私の知る限り (10 か月前のもの)、設定できる JobTracker のバックアップはありません。そのため、JobTracker がダウンした場合に監視し、正しい設定で新しい JobTracker を起動するのはあなた次第です。