Hadoop でデータを取得する方法について、いくつか混乱があります。
mapReduce は Hadoop クラスター (HDFS) からデータを取得するためのものですか、それとも集約に限定されているだけですか。
Hadoop はシーケンシャル検索をサポートしていますが、hadoop がデータを並列処理しているとは言えません。検索は、各ノードをトラバースしながら処理することとどう違うのでしょうか?
間違っている場合は訂正してください。ノードごとのブロックは順次読み取られますが、多くのノードはクラスター内で並列に処理されます。つまり、2 つのジョブが 2 つの異なるノードで並行して実行され、各ジョブはノードごとに関連するすべてのブロックを同時に順次検索します。例: ノード 1: ブロック A。ブロック B、ブロック C ノード 2: ブロック D、ブロック E、ブロック F 私の仮定: ブロック A-> ブロック B-> ブロック C || Dブロック、Eブロック、Fブロック
-> はシーケンシャルです || 平行です。
- 4 人の従業員のうち、過去 2 年間に会社から最大の利益 (現金) を受け取った 1 人の従業員を検索したいとします。ここでの検索と取得はどのように機能しますか。