非常に大きなテーブルがあり、それはより速く成長する可能性があります。たとえば、Sqooping で毎日 1,000 万レコードを HBase に取り込むことができます。HBase でテーブルを作成するときに事前分割を使用するかどうかがわかりました。これは、高速なスキャンと取得、および更新に非常に役立ちます。スクーピング中に HBase でテーブルを事前に分割する方法。
データを一時テーブルにスクープし、事前分割を使用して HBase に実際のテーブルを作成し、スクープしたテーブルで変換を行い、データを新しいテーブルに挿入することでこれを達成できることを私は知っています。
スクープしたテーブルを HBase Transformation に行かずに処理できる方法はありますか?