4

EC2に6つのリージョンサーバーを備えた小さなHbaseクラスターがあります。最近、列ファミリーの1つのデータが実際にはそれほど有用ではないことがわかり、それをチャックすることにしました。この特定の列ファミリーは、ディスク上のスペースの50%以上を占めます。テーブルを変更し、列ファミリーを削除して、主要な圧縮を実行しました。また、「-ROOT-」と「.META」でメジャーコンパクションを実行しました。テーブル。しかし、DFSファイルの合計サイズはまだ減少していませんか?ここで何かが足りませんか。ヘルプ/ポインタをいただければ幸いです。

よろしく。

4

2 に答える 2

1

とった!これはHbaseのバグでした。彼らはHDFSからファイラーを削除していません。hadoop-filesシステムからファイルを見つけて削除する必要がありました。

于 2012-09-02T17:20:25.093 に答える
1

チェックする別のことを追加するだけです-少なくともHbase 0.90.4では、テーブルを削除するとHDFSからファイルが削除されますが、.logsディレクトリの内容は必ずしもそうではありません。

たとえば、実行するhadoop fs -du /yourHbaseDirInDFSと、まだデータのチャンクが含まれている .logs ディレクトリが表示されます。これは、HBase クラスターを再起動するまで解消されないようです。または、ログ ファイルを手動で削除することもできると思いますが、hbase に任せたほうがよいようです。

于 2013-02-19T20:48:18.090 に答える