2

クラスターには 4 つのノードがあります。スナップショットを作成するときに、クラスターから最新のデータをチェックするか、そのノード データのみから取得するかを確認します。私の質問は、スナップショットが最新のデータを提供するかどうかです。

最新のデータが提供される場合、クラスター内のすべてのノードでスナップショットを作成する必要はありませんよね?

4

1 に答える 1

3

スナップショットは、すべての memtables をディスクにフラッシュ (つまり、sstables を作成) して、すべての最新のノード データがスナップショットに存在するようにします。このコマンドはノード レベルで機能します。つまり、すべてのノードを一度にバックアップするのではなく、ノードごとに最新のデータをバックアップします。

DataStax ドキュメントに記載されているアドバイスは、すべてのデータを同時にバックアップする場合は、リクエストを並行して実行できるコマンドライン ユーティリティを使用する必要があるというものです (推奨されるユーティリティはpsshです)。

最新のデータが提供される場合、クラスター内のすべてのノードでスナップショットを作成する必要はありませんよね?

単一ノード環境を実行していない限り、Cassandra を使用しているときにデータを毎日バックアップする必要があるケースは実際には見当たりません (C* の場合は少し無意味に思えます)。レプリケーション ファクターが十分に高い場合、データは常にバックアップされます。すべてのサーバー (クラスター全体) が同時に爆発するような壊滅的なハードウェア障害が予想される場合を除き、毎日バックアップする必要はありません。

于 2013-07-11T13:11:40.793 に答える