hadoop - Mapreduceを使用してHtableにデータをロードできません

Question

私はHbaseとHadoopを初めて使用します。MapReduceの概念に混乱しているので、Mapreduce F/wでの実行の流れを知りたいです。Putファイルからデータを読み取り、reducerを使用するクラスを使用してデータをHtableにロードする方法をGoogleで検索してみました。HDFSにファイルがあり、Hbase Mapreducerから読み取り、データをHtableにロードする必要があります。

どこが間違っていたのか誰かに教えてもらえますか？

score 0 · Accepted Answer

削減ステップは使用しないでください。マップクラスで、レコードを取得したら、それをHBaseに直接挿入します。プットをHBaseに送信する前に、プットをシャッフル/ソートする必要はありません。つまり、HTableのインスタンス変数を作成し、それをsetupメソッドで初期化するだけです。次に、mapメソッドで、レコードのputを作成し、それをHTableに追加します。最後に、クリーンアップ方法で、必ずHTableをフラッシュしてください。

score 0 · Accepted Answer

マッパーはレデューサーなしで使用できます。レデューサーは並べ替えに使用でき、ファイルデータをHbaseに直接保存する必要があるためです。

hadoop - Mapreduceを使用してHtableにデータをロードできません

2 に答える 2

Related

Reference