hadoop - HADOOP_HOME と Hadoop ストリーミング

Question

こんにちは、hadoop がインストールされているサーバーで hadoop を実行しようとしていますが、hadoop が存在するディレクトリがわかりません。サーバーはサーバー管理者によって構成されました。

Hadoop をロードするために、dotkit パッケージの use コマンドを使用します。

いくつかの解決策があるかもしれませんが、hadoop パッケージがインストールされた場所、$HADOOP_HOME 変数の設定方法、および $HADOOP_HOME/bin/hadoop jar $HADOOP_HOME/mapred/contrib などの Hadoop ストリーミングジョブの適切な実行方法を知りたいと考えていました。 /streaming/hadoop-streaming.jar、別名、http://wiki.apache.org/hadoop/HadoopStreaming.

ありがとう！どんな助けでも大歓迎です！

score 9 · Accepted Answer

cloudera ディストリビューションを使用している場合は、おそらく/usr/lib/hadoop.

探して見つけるために使用できるいくつかのトリックがあります。

locate hadoop-env.sh(locate がインストールされ、updatedb が最近実行されたと仮定します)
これを実行しているマシンが Hadoop サービス (データノード、ジョブトラッカー、タスクトラッカー、名前ノードなど) を実行している場合は、hadoop コマンドのプロセスリストと grep を実行できます。ps axww | grep hadoop
/usr/lib上記の 2 つに失敗した場合は、次のような一般的な場所で Hadoop ルートディレクトリを探します/usr/local。/opt
これらすべてに失敗し、現在のユーザーに権限があると仮定します。find / -name hadoop-env.sh

score -4 · Accepted Answer

試してみませんか：

echo $HADOOP_HOME

明らかに、ボックスのどこからでも Hadoop 実行可能ファイルを発行する前に、上記の環境変数を設定する必要があります。

hadoop - HADOOP_HOME と Hadoop ストリーミング

3 に答える 3

Related

Reference