「何か良い方法はありますか?」
すべての Cassandra データは data/ フォルダーに保存されます ( cassandra.yamlの構成値data_file_directoriesを確認してください)。また、 saved_caches_directoryおよびcommitlog_directory構成を確認することもできます。
データフォルダー内には、
キースペースごとに 1 つのフォルダー
システム キースペース用の 1 つのフォルダー
認証などのためのいくつかのフォルダ..
各キースペース フォルダー内には、
*-実際のデータを含む Data.db ファイル
*-Filter.db ファイル
*-インデックス用のIndex.dbファイル
...
データをレプリケートするには、それらのフォルダーの単純なコピーを作成します。
私たちのチームでは、運用担当者が crontab を使用して、この方法で Cassandra データの定期的なバックアップをスケジュールしています。
注: 場合によっては、まだメモリ内または memtable 内にあり、まだディスクにフラッシュされていないライブ データを見逃すことがあります。データ ファイルをバックアップする前に、完全な圧縮を開始できます。ただし、完全に圧縮するとパフォーマンスが低下する可能性があるため、注意してください
より良い答え: 提供されたツールを使用して、DB のスナップショットを作成します。
http://www.datastax.com/docs/1.0/operations/backup_restore