「users」というhbaseテーブルがあります。rowkeyは次の3つの部分で構成されています。
- ユーザーID
- messageid
- タイムスタンプ
行キーは次のようになります。${userid}_${messageid}_${timestamp}
ユーザーIDをハッシュしてフィールドの長さを固定できるとすると、とにかくSQLクエリのようなクエリを実行できますか?
select distinct(userid) from users
行キーでこのようにクエリを実行できない場合、それは、すべてのユーザーIDを含む個別のテーブルを作成する必要があることを意味しますか?そのようなことをすると、レコードを挿入するときにアトミックではなくなると思います。トランザクションなしで2つのテーブルを処理しているからです。