“reducers”の関連問題_Stack Overflow日本語サイト

0 投票する

4 に答える

8283 参照

hadoop - パフォーマンスを向上させるために使用されるインスタンスの数に応じて、hadoop のマッパーとレデューサーを増やす方法は?

マッパーの数を増やしてレデューサーの数を減らすと、実行中のジョブのパフォーマンス (増加/減少) に違いはありますか?

また、マッパーとレデューサーの数を設定するにはどうすればよいですか? 私はこの設定で遊んだことがないので、これについてはわかりません。私は Hadoop を知っていますが、Hive をよく使用するため、コードを持っています。

また、マッパーとリデューサーの数を増やしたい場合は、それを設定する方法と、設定する値までです。インスタンスの数（10としましょう）に依存していますか？

これを試してパフォーマンスを確認したいので、返信してください。ありがとう。

2012-05-04T11:44:12.557

0 投票する

1 に答える

2846 参照

hadoop - Hadoopでジョブを実行する際にマッパーとリデューサーに設定する値とその決定方法は?

Hadoop クラスターで Hive ジョブを実行しています。異なる動作マッパーとリデューサーに集中するだけで、パフォーマンスが向上/変化することを知りました。しかし、私はそれまで遊んだことがありません。いいえまで、Hive で遊んで、デフォルトのマッパーとリデューサーでクエリを実行しましたか?

マッパーとレデューサーについて知っているので、パフォーマンスが得られるようにマッパーとレデューサーに設定する値が異なることを心配しています。また、マスターノードのみに設定する必要があるのか、それともすべてのノードに設定する必要があるのかも考えています。

これに関連する考えがある人は、これについてのシナリオを説明してください。

また、ジョブの実行中に設定する必要がある他のパラメーターは何ですか?

hadoop mapper reducers

2012-05-08T05:26:38.883

0 投票する

1 に答える

842 参照

hadoop - hadoop reduce 関数が実行されていませんか?

mapreduce プログラムを実行していますが、reduce 関数を書いても mapreduce が実行しないことに気付きました。次に、を追加しようとする@Overrideと、reduce 関数がスーパーメソッドをオーバーライドしないというエラーが表示されます。

ジョブ構成情報は以下の通り

リデュースコードは以下の通り

hadoop reducers

2012-06-08T21:29:33.683

0 投票する

1 に答える

96 参照

hadoop - JobTRacker は、実際のデータ転送前のシャッフルフェーズ中に各 reduce タスクに転送されるデータの量を認識していますか?

Hadoop では、JobTracker は、実際のデータ移動の前に、各 ReduceTask が (シャッフルフェーズで) 取得する必要があるデータの量を知ることができますか? シャッフルフェーズ中のデータ移動に関する統計を収集しようとしています。

hadoop reducers

2012-07-03T21:36:47.210

0 投票する

4 に答える

26910 参照

mapreduce - コンバイナーとリデューサーは異なる場合がありますか?

多くの MapReduce プログラムでは、リデューサーがコンバイナーとしても使用されています。これは、これらのプログラムの特定の性質によるものであることはわかっています。しかし、私はそれらが異なることができるかどうか疑問に思っています。

mapreduce reducers combiners

2012-07-31T01:04:36.647

0 投票する

1 に答える

112 参照

mapreduce - レデューサーの出力キーの型が入力と異なることはありますか?

実際、レデューサーへの私のキーはカスタムキー（word1、word2）であり、出力を "word1\tword2" のような形式で書きたいと思っています。そして、私はそれを行うことができません。

どんな助けでも感謝します。

ありがとう。

編集: ペアの間には既に \t がありました... 気がつきませんでした!

mapreduce text-formatting reducers

2012-10-02T05:35:48.087

0 投票する

2 に答える

2406 参照

hadoop - 同じファイルへの同じレデューサー出力を使用するHadoopジョブ

私は興味深い状況に遭遇しました、そして今それを意図的に行う方法を探しています。ローカルの単一ノードのセットアップで、ターミナル画面から2つのジョブを同時に実行しました。私の両方のジョブは同じレデューサーを使用していますが、マップ関数（集計キー-group by）にのみ違いがあり、両方のジョブの出力は最初のジョブの出力に書き込まれました（2番目のジョブは独自のフォルダーを作成しましたが、空でした））。私が取り組んでいるのは、さまざまなレベルにまたがるロールアップ集約を提供することです。この動作は、2つの異なるレベルからの集約出力を1つのファイルで利用できる（完全にソートされている）という点で魅力的です。

私の質問は、複数のデータノードがある実際のHadoopクラスターで同じことを実現する方法です。つまり、プログラムで複数のジョブを開始し、すべて同じ入力ファイルにアクセスし、データを異なる方法でマッピングしますが、同じレデューサーを使用し、出力は1つで利用できます。単一のファイルであり、5つの異なる出力ファイルではありません。

お知らせ下さい。

質問をする前に、reduceフェーズ後のマージ出力ファイルを調べていました。

よろしくお願いいたします。

Moiz Ahmed

hadoop mapreduce output reducers

2012-10-23T11:51:13.327

0 投票する

0 に答える

67 参照

.net - PLINQ のレデューサーとコンバイナーのセマンティクス

Clojure 1.5 のライブラリに触発されてreducers、私は PLINQ のParallelEnumerable.Aggregate()メソッドを同じように動作させることを試みてきました。ほとんどの場合、それは非常に簡単です。

ただし、存在する可能性があると思われる動作の違いが 1 つあります。2007 CTP に関する Igor Ostrovsky のブログ投稿combineAccumulatorsFuncで、彼はそれが交換可能でなければならないと主張しています。現代のドキュメンテーションは、それが交換可能でなければならないことについて何も言っていないようで、交換可能性に依存することを強制することはできませんでしたが、それを強制することもできませんでした結合性に依存します。

主な質問:のセマンティクスはcombineAccumulatorsFuncどこでも定義されていますか? そうでない場合でも、連想的に呼び出される可能性があるが交換可能に呼び出される可能性があると仮定しても大丈夫でしょうか?

次の LINQPad スニペットを使用して、順不同のcombineAccumulatorsFunc呼び出しを発生させようとしています。

.net plinq reducers

2013-01-07T01:33:26.030

0 投票する

1 に答える

1272 参照

map - Clojureレデューサーライブラリ-最大で折りたたみ

次の例を新しいClojure1.5レデューサーライブラリに変換しようとしています。

変更すると、次のエラーが発生します。

誰かが私に正しい解決策を教えてもらえますか？

map clojure reduce reducers

2013-01-07T08:23:43.450

0 投票する

1 に答える

296 参照

clojure - clojure.core.reducersを使用して「partition」関数を実装することは可能ですか？

私は次の機能を持っています：

clojure.core.reducersを使用して中間の2要素コレクションの作成を回避することは可能ですか？

clojure reducers

2013-01-13T21:05:05.760

問題タブ [reducers]

Reference