最近、Hadoopの学習に出くわしました。見つけたのは、テキストデータを読み取って単語数を計算するための例にすぎませんでした。多かれ少なかれすべての例は同じタスクでした。それがhadoopの唯一のユースケースであることを理解するのを手伝ってください。より実際のユースケース、またはHadoopを使用できる場所を理解して記述できる場所について、いくつかのリファレンスを提供してください。
ありがとう
最近、Hadoopの学習に出くわしました。見つけたのは、テキストデータを読み取って単語数を計算するための例にすぎませんでした。多かれ少なかれすべての例は同じタスクでした。それがhadoopの唯一のユースケースであることを理解するのを手伝ってください。より実際のユースケース、またはHadoopを使用できる場所を理解して記述できる場所について、いくつかのリファレンスを提供してください。
ありがとう
MapReduce に限定するいくつかの方向性を概説することができます: a) ETL - データ変換。レイテンシは重要ではないため、ここでは Hadoop が優れていますが、スケーラビリティは
b) ハイブ / ピッグです。大きなデータ セットに対して実際に SQL または SQL のような機能が必要な場合がありますが、商用の MPP データベースを購入する余裕はありません
。c) さまざまな種類のログ処理。
d) ディープ アナリティクス - 大量のデータに対して Java コードを実行したいだけの場合。Mahaout は、機械学習ライブラリとして多くの場合に使用されます。