java - ジョブの HBase 複数テーブルスキャン

翻译自：https://stackoverflow.com/questions/14077766 2012-12-29T01:06:10.313

4825 次

私は次のシナリオを見ています。データファイルを毎日送信しています。これを file-yyyyMMdd 形式の名前で HBase に追加します。したがって、一定期間にわたって、たとえば多くのデータベースがあります

tempdb-20121220
tempdb-20121221
tempdb-20121222
tempdb-20121223
tempdb-20121224
tempdb-20121225

今私がしたいのは、特定の日付範囲に対して、テーブルがその範囲に一致する場合にリストを取得して、インデックスを作成できるようにすることです。hbase-0.90.6 を使用しています

私の調査によると、TableMapReduceUtil.initTableMapperJob は 1 つの tableName しか取りません。

TableMapReduceUtil.initTableMapperJob(
tableName,        // input HBase table name
scan,             // Scan instance to control CF and attribute selection
HBaseIndexerMapper.class,   // mapper
null,             // mapper output key
null,             // mapper output value
job
);

テーブルのリストを取得してループで実行することができましたが、すべてのテーブルをループしてスキャンし（または他の何かを）、最終的にインデックス作成の目的でマージ/結合結果を取得できるようにするという考えです.

これを達成するための方向性は素晴らしく、役に立ちます。

java - ジョブの HBase 複数テーブル スキャン

2 に答える 2

Related

Reference

java - ジョブの HBase 複数テーブルスキャン