Hadoop と Hbase は初めてです。hbase テーブル内の選択されたデータ領域を Map reduce できる方法があるかどうかを知りたいです。つまり、完全なテーブルを取得して領域の数に基づいてタスクを分割する代わりに、Map reduce が取得するテーブルの領域を指定できる方法はありますか? いくつかのコード スニペットが非常に役立ちます。
どうもありがとう。
処理の開始行と終了行を設定できます。一度実行すると、HBase Web UI でリージョンの開始キーと停止キーを取得できます。
これは、スキャンをパラメーターとして受け入れる TableMapReduceUtil を使用して行うことができます。内部的に (私が思うに) setStartRow と setStopRow を TableInputFormat に呼び出します)
ここで例を見つけることができます:
http://massapi.com/class/org/apache/hadoop/mapreduce/Job.java.html (ページで setStartRow を検索) .