問題タブ [hadoop2]

質問する

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

2060 問題

0 投票する

0 に答える

148 参照

java - Hadoop 分散キャッシュのファイルはディレクトリとして表示されます

Hadoop で DistributedCache を使用する場合、次のようにドライバクラスで hdfs からファイルをプッシュできます。

次に、Mapper の setup() でファイルを読み取るために、次のようにします。

ファイルは、パス /tmp/solr-map-reduce/yarn-local-dirs/usercache/user/appcache/application_1398146231614_0045/container_1398146231614_0045_01_000004/file.txt の下のキャッシュにあります。しかし、それを読むと、IOException: file is a directory が発生します。

どうすればこれを解決できますか？

2014-04-24T11:08:01.487

0 投票する

3 に答える

1245 参照

hadoop - Hadoop の複数のレデューサーから単一のファイルに書き込む

Hadoop を使用して Kmeans を実行しようとしています。Reducer の cleanup メソッドで計算されたクラスターの重心をいくつかのファイルに保存したいと思いますcentroids.txt。ここで、複数のレデューサーのクリーンアップメソッドが同時に開始され、それらすべてが同時にこのファイルに書き込もうとするとどうなるかを知りたいと思います。内部で処理されますか？そうでない場合、このタスクを同期する方法はありますか?

これはレデューサーの私の出力ファイルではないことに注意してください。これは、重心を追跡するために私が維持している追加のファイルです。これを行うために、レデューサーのクリーンアップメソッドから BufferedWriter を使用しています。

hadoop file-io mapreduce hadoop2

2014-04-25T17:06:36.653

0 投票する

1 に答える

34 参照

hadoop - Hadoop 2.0 スケジューラはマルチユーザーシナリオでのみ機能しますか?

Fair および Capacity スケジューラは、複数のユーザーが異なるジョブを送信している場合にのみ機能しますか? それとも、1 人のユーザーから送信されたジョブにも取り組んでいますか?

ありがとう

hadoop scheduler job-scheduling hadoop-yarn hadoop2

2014-04-28T01:20:35.673

0 投票する

3 に答える

9718 参照

hadoop - Mapreduce にコマンドラインパラメーターを渡す

map reduce に新しい API を使用して、通常の expession を -D コマンドラインパラメーターとして使用しようとしていますが、取得されません。その結果、Pattern.compile(pattern) はNullPointerException

私のマッパーコードは;

そして私のコントローラーコードは;

}

最後に、私が行っているコマンドライン呼び出しは次のとおりです。

構成パラメーター mapper.pattern を取得できない理由はありますか?

hadoop mapreduce hadoop2

2014-05-02T19:00:06.743

0 投票する

2 に答える

535 参照

hadoop - Hadoop のカスタムカウンターの代替テキスト

次のカウンターが定義されています

そして、それらは以下のように表示されます

これらに代替テキストを使用するメカニズムがあるかどうか疑問に思っています。たとえば、カウンターグループをFQCN ではなく、Bad Record Countersとして読み取る必要があります。

hadoop mapreduce hadoop2

2014-05-07T01:49:04.993

0 投票する

2 に答える

213 参照

hadoop - MapReduce - 各学生について、学生が最も多くの投稿を投稿した時間は何時ですか

Hadoop に SO レコードのダンプがあります。次の質問に答える良い方法は何だろうと思っています

サンプルレコード

私の最初のカット

キー = userid_hour

これで、各ユーザーの投稿数が 1 時間ごとにわかるようになりました。次に、このデータを後処理して、ユーザーごとの最大数を選択し、最もアクティブな時間を確認する必要があります。

質問

これを簡素化するために必要な他の選択肢は何ですか?

hadoop mapreduce hadoop2

2014-05-07T17:00:47.043

1 2 3 4 5 6 7 8 9 10

問題タブ [hadoop2]

java - Hadoop 分散キャッシュのファイルはディレクトリとして表示されます

hadoop - Hadoop の複数のレデューサーから単一のファイルに書き込む

hadoop - Hadoop 2.0 スケジューラはマルチユーザー シナリオでのみ機能しますか?

hadoop - Mapreduce にコマンド ライン パラメーターを渡す

hadoop - Hadoop のカスタム カウンターの代替テキスト

hadoop - MapReduce - 各学生について、学生が最も多くの投稿を投稿した時間は何時ですか

Reference

hadoop - Hadoop 2.0 スケジューラはマルチユーザーシナリオでのみ機能しますか?

hadoop - Mapreduce にコマンドラインパラメーターを渡す

hadoop - Hadoop のカスタムカウンターの代替テキスト