0

現時点では、データが HBase テーブルに格納されていることを確認したいと思います。正確な行数は必要ありません。そのためにcount 'table_name'、HBase シェルでコマンドを 2 回実行しています。

hbase(main):001:0> count 'test_table', 100000
...
558549 row(s) in 360.1440 seconds

hbase(main):001:0> count 'test_table', 100000
...
558623 row(s) in 354.0270 seconds

ただし、行数が多い場合 (> 200,000)、時間がかかりすぎます。

それを行う最も効率的な方法は何ですか?

4

1 に答える 1

4

より大きなキャッシュ値でcountコマンドを使用してみてください。デフォルトは10だと思います

count 'test_table', CACHE => 1000

それでも遅すぎる場合は、MapReduce ジョブを使用してみてください。

Run '$HADOOP_HOME/bin/hadoop jar hbase.jar rowcount'
于 2012-10-11T15:36:07.733 に答える