問題タブ [cloudera-manager]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
api - cloudera manager API を介して jobtracker を再起動します
Cloudera Manager API を介して Mapreduce Jobtracker を再起動しようとしています。Jobtracker の統計は次のとおりです。
わからない API を使用して Jobtracker だけを再起動するにはどうすればよいですか?
次のコマンドを使用して Hive サービスを再起動しようとしましたが、エラーが発生しました
Cloudera Manager APIの使用方法を理解するのに誰かが助けてくれれば幸いです
hadoop - HUE サービスを別のホストに移動する
Cloudera Manager を使用して、ホスト間で HUE をクラスター内の別のホストに移動したいと考えています。
可能です?
python - Python 2.7 の使用時に cloudera-scm-agent が失敗する
これを回避する方法がわからない... cloudera-manager サイトでは、ソフトウェアに pyhton2.6 または python2.7 が必要であると書かれています
ただし、cloudera-scm-agent を開始しようとすると、次のように不平を言います。
centos7 を実行しています (そのままではサポートされていません)。
さらに悪いことに、私は Python についても何も知りません (申し訳ありません)...何かをインストールする必要がある場合は、段階的な手順を提供してください :-)
linux - リモートジョブ送信のための典型的な Hadoop セットアップ
そのため、私はまだ Hadoop に少し慣れておらず、現在 Amazonaws で小さなテスト クラスターをセットアップしている最中です。したがって、私の質問は、クラスターの構造化に関するいくつかのヒントに関連しているため、リモート マシンからサブミット ジョブを実行できます。
現在、私は5台のマシンを持っています。4 は基本的に NameNodes、Yarn などを含む Hadoop クラスターです。1 台のマシンはマネージャー マシン (Cloudera Manager) として使用されます。セットアップに関する私の思考プロセスを説明します。誰かが私がはっきりしていない点を指摘してくれれば、それは素晴らしいことです.
小さなクラスターに最適なセットアップは何かを考えていました。そこで、マネージャー マシンを 1 つだけ公開し、おそらくそれを使用してすべてのジョブを送信することにしました。他のマシンはお互いを認識しますが、外部からはアクセスできません。私はこれを行う方法について概念的な考えを持っていますが、誰かが私を正しい方向に向けることができれば、これを適切に行う方法がわかりません。
また、もう 1 つの大きなポイントは、クライアント マシン (Windows の可能性があります) から公開マシンを介してクラスターにジョブを送信できるようにしたいということです。この設定についてもよくわかりません。通常の Hadoop コマンドを使用し、Eclipse などからジョブを作成/送信するには、Hadoop をマシンにインストールする必要がありますか?
要約すると、私の質問は、
- これは小規模なテスト クラスタの設定で問題ありませんか
- 1 台の公開されたマシンを使用して、Hadoop ノードをまったく持たずにジョブをクラスターに送信/ルーティングするにはどうすればよいでしょうか。
- リモート クラスタにジョブを送信するようにクライアント マシンをセットアップする方法と、Windows での実行方法の例。また、このセットアップで Windows をクライアント マシンとして使用しない理由がある場合。
ありがとう、これに関するアドバイスや助けをいただければ幸いです。
hadoop - Hadoop エコシステムのリアルタイム データベース
これがばかげた質問である場合は、ご容赦ください。
単一ノードに Cloudera Manager をインストールしています。
Web アプリケーションでの要求と応答のログ記録に Hbase と Hadoop を使用しようとしています。
ログを使用して最新のユーザー アクティビティを一覧表示しようとしています。
行は、以下のテーブル構造を使用して追加されます。
1 列ファミリー、RowId、11 列。すべての値を文字列として保存します。かなりシンプルで、mysql テーブルに似ています。
ここで、Hbase から行を取得するために、
今、私はこれを注文するのに苦労しています
entry:completeDate DESCENDING
ページネーションまたは無限スクロールのために 25 行までに制限します。
私の質問、
Hbase は、Hadoop エコシステムで利用できる唯一のリアルタイム クエリ データベースですか?
間違った理由で Hbase を使用していますか? 私のテーブル構造は正しいですか?
私はスタートアップで働いており、これらは BigData に移行するための小さなステップです。BigData は多くの誇大広告を作成しましたが、Hadoop は最新の Linux でサポートされておらず、複雑すぎるように見えます。
ヘルプや提案をいただければ幸いです。
どうもありがとう、
カーシック