1

私は hadoop に非常に慣れておらず、その map/reduce 機能について少し学び、 wordcount demo を理解していますが、データベース固有の計算に関連して hadoop map/reduce を実際に使用することはできません。これは、map/reduce が一部の計算やデータベース固有の処理に役立つという正しい方法ではありません。Hadoop マップ/リデュース部分をよりよく理解するために、何が最適な使用法であり、どのセネリオを実装できるかを理解するのに役立つリンクまたはガイドを提供してもらえますか。

4

1 に答える 1

2

Hadoop には、いくつかの入力形式と出力形式が用意されています。基本のInputFormatおよびOutputFormatクラスは、カスタマイズされた入力/出力形式用に拡張できます。

DBInputFormat/DBOutputFormat は Hadoop に付属しています。データベースでの MapReduce の使用に関する Cloudera のドキュメントを次に示します。

于 2013-02-14T16:04:54.853 に答える