私はHbaseとHadoopを初めて使用します。MapReduceの概念に混乱しているので、Mapreduce F/wでの実行の流れを知りたいです。Put
ファイルからデータを読み取り、reducerを使用するクラスを使用してデータをHtableにロードする方法をGoogleで検索してみました。HDFSにファイルがあり、Hbase Mapreducerから読み取り、データをHtableにロードする必要があります。
どこが間違っていたのか誰かに教えてもらえますか?
削減ステップは使用しないでください。マップクラスで、レコードを取得したら、それをHBaseに直接挿入します。プットをHBaseに送信する前に、プットをシャッフル/ソートする必要はありません。つまり、HTableのインスタンス変数を作成し、それをsetupメソッドで初期化するだけです。次に、mapメソッドで、レコードのputを作成し、それをHTableに追加します。最後に、クリーンアップ方法で、必ずHTableをフラッシュしてください。
マッパーはレデューサーなしで使用できます。レデューサーは並べ替えに使用でき、ファイルデータをHbaseに直接保存する必要があるためです。