2

こんにちは、hadoop がインストールされているサーバーで hadoop を実行しようとしていますが、hadoop が存在するディレクトリがわかりません。サーバーはサーバー管理者によって構成されました。

Hadoop をロードするために、dotkit パッケージの use コマンドを使用します。

いくつかの解決策があるかもしれませんが、hadoop パッケージがインストールされた場所、$HADOOP_HOME 変数の設定方法、および $HADOOP_HOME/bin/hadoop jar $HADOOP_HOME/mapred/contrib などの Hadoop ストリーミング ジョブの適切な実行方法を知りたいと考えていました。 /streaming/hadoop-streaming.jar、別名、http://wiki.apache.org/hadoop/HadoopStreaming.

ありがとう!どんな助けでも大歓迎です!

4

3 に答える 3

9

cloudera ディストリビューションを使用している場合は、おそらく/usr/lib/hadoop.

探して見つけるために使用できるいくつかのトリックがあります。

  1. locate hadoop-env.sh(locate がインストールされ、updatedb が最近実行されたと仮定します)
  2. これを実行しているマシンが Hadoop サービス (データ ノード、ジョブ トラッカー、タスク トラッカー、名前ノードなど) を実行している場合は、hadoop コマンドのプロセス リストと grep を実行できます。ps axww | grep hadoop
  3. /usr/lib上記の 2 つに失敗した場合は、次のような一般的な場所で Hadoop ルート ディレクトリを探します/usr/local/opt
  4. これらすべてに失敗し、現在のユーザーに権限があると仮定します。find / -name hadoop-env.sh
于 2012-10-02T10:39:43.683 に答える
-4

試してみませんか:

echo $HADOOP_HOME

明らかに、ボックスのどこからでも Hadoop 実行可能ファイルを発行する前に、上記の環境変数を設定する必要があります。

于 2012-11-13T22:46:59.987 に答える