hadoop - mapReduce とシーケンシャルアプローチ

翻译自：https://stackoverflow.com/questions/19548716 2013-10-23T17:42:58.867

1307 次

0

Hadoop でデータを取得する方法について、いくつか混乱があります。

mapReduce は Hadoop クラスター (HDFS) からデータを取得するためのものですか、それとも集約に限定されているだけですか。
Hadoop はシーケンシャル検索をサポートしていますが、hadoop がデータを並列処理しているとは言えません。検索は、各ノードをトラバースしながら処理することとどう違うのでしょうか?
間違っている場合は訂正してください。ノードごとのブロックは順次読み取られますが、多くのノードはクラスター内で並列に処理されます。つまり、2 つのジョブが 2 つの異なるノードで並行して実行され、各ジョブはノードごとに関連するすべてのブロックを同時に順次検索します。例: ノード 1: ブロック A。ブロック B、ブロック C ノード 2: ブロック D、ブロック E、ブロック F 私の仮定: ブロック A-> ブロック B-> ブロック C || Dブロック、Eブロック、Fブロック

-> はシーケンシャルです || 平行です。

4 人の従業員のうち、過去 2 年間に会社から最大の利益 (現金) を受け取った 1 人の従業員を検索したいとします。ここでの検索と取得はどのように機能しますか。

1 に答える 1