私は次のシナリオを見ています。データファイルを毎日送信しています。これを file-yyyyMMdd 形式の名前で HBase に追加します。したがって、一定期間にわたって、たとえば多くのデータベースがあります
tempdb-20121220
tempdb-20121221
tempdb-20121222
tempdb-20121223
tempdb-20121224
tempdb-20121225
今私がしたいのは、特定の日付範囲に対して、テーブルがその範囲に一致する場合にリストを取得して、インデックスを作成できるようにすることです。hbase-0.90.6 を使用しています
私の調査によると、TableMapReduceUtil.initTableMapperJob は 1 つの tableName しか取りません。
TableMapReduceUtil.initTableMapperJob(
tableName, // input HBase table name
scan, // Scan instance to control CF and attribute selection
HBaseIndexerMapper.class, // mapper
null, // mapper output key
null, // mapper output value
job
);
テーブルのリストを取得してループで実行することができましたが、すべてのテーブルをループしてスキャンし(または他の何かを)、最終的にインデックス作成の目的でマージ/結合結果を取得できるようにするという考えです.
これを達成するための方向性は素晴らしく、役に立ちます。