1

メジャー コンパクションでは、リージョン サーバー (Hbase) からのすべての sstable とタブレット サーバー (Cassandra) からのすべての SSTable を大きなものにマージします。

ピリオドが来たら、平均的な SSTables (1 TB を超える合計スペース) が 1 つにマージされますか? SSTable または HFile には、いくつかの部分に分割するいくつかの範囲境界があります。マージ操作で「すべてのサーバーを書き換える」ことがないようにするためですか?

私の質問は、このリンクの「圧縮」セクションに関連しています http://wiki.apache.org/cassandra/MemtableSSTable

4

1 に答える 1

1

私が実際に見つけたものから、主要な圧縮によって生成されたSSTableはCassandraで分割されていません。他のLSMツリーデータベースは、この場合、SSTable(またはHFile、HypertableのCellSotre)をいくつかのファイル(たとえば64MB)に分割する乱れたファイルシステムに依存していますが、主要な圧縮では、このファイルすべてを新しいSSTableに圧縮する必要があります(私は非効率的な)。

前述のように、Jira には Cassandra の圧縮を改善および再設計するためのチケットがあります。

https://issues.apache.org/jira/browse/CASSANDRA-1608

私の 2 番目の同様の質問もお読みください。

Cassandra クラスターのノードあたりのデータ量は?

于 2011-01-29T21:00:40.003 に答える