HBase でデータを移動するために使用するいくつかの ETL プロセスの検証を自動化できるように、HBase で 2 つの異なるテーブルを比較しようとしています。HBase で 2 つのテーブルを比較する最良の方法は何ですか?
私のユースケースは以下のとおりです。
私がやろうとしているのは、期待される出力となるテーブルを 1 つ作成することです。このテーブルには、入力ファイルに対してチーム コードを実行することで作成されると予想されるすべてのデータが含まれます。次に、実際の出力テーブルと予想される出力テーブルの差分を取得して、テスト対象のコンポーネントの整合性を検証します。