hadoop - 入力データが保存されていない場合、Hadoop/MapReduce はどのようにスケーリングしますか?

翻译自：https://stackoverflow.com/questions/16780181 2013-05-27T20:30:53.063

483 次

Hadoop の使用目的は、入力データが分散(HDFS) され、マッピングプロセスの時点でノードのローカルに既に保存されている場合のようです。

保存する必要のないデータがあるとします。データは実行時に生成できます。たとえば、マッピングプロセスへの入力は、考えられるすべての IP アドレスになります。Hadoop は Mapper の作業をノード間で効率的に分散できますか? 入力データ (つまり、IP アドレス空間) を異なるノードに分割する方法を明示的に定義する必要がありますか? それとも Hadoop が自動的に処理しますか?

hadoop - 入力データが保存されていない場合、Hadoop/MapReduce はどのようにスケーリングしますか?

3 に答える 3

Related

Reference