何百万ものレコードを含む HBase テーブルがあります。何らかの目的で、テーブル内のレコード数をリアルタイムでクエリする必要があります。
- rowcount MR ジョブの使用はオプションではありません。(急いで欲しい)
- ResultScanner の使用は遅いです。数千のレコードしかない場合、数秒かかります。
完全にリアルタイムにする唯一の方法は、行数を追跡してどこかに保存することです。新しい行を配置するたびに更新します。その後、必要なときにいつでも提供してください。リアルタイム性が本当に必要な場合、上記のオプションはどちらも役に立ちません。
できません - HBase はこの機能をサポートしていません。Tariq の提案を使用できますが、HBase にはクロステーブル トランザクションがないことに注意してください。そのため、一方に蓄積した数が他方の行の正確な数を反映しているという保証はありません。