クラスターには 4 つのノードがあります。スナップショットを作成するときに、クラスターから最新のデータをチェックするか、そのノード データのみから取得するかを確認します。私の質問は、スナップショットが最新のデータを提供するかどうかです。
最新のデータが提供される場合、クラスター内のすべてのノードでスナップショットを作成する必要はありませんよね?
クラスターには 4 つのノードがあります。スナップショットを作成するときに、クラスターから最新のデータをチェックするか、そのノード データのみから取得するかを確認します。私の質問は、スナップショットが最新のデータを提供するかどうかです。
最新のデータが提供される場合、クラスター内のすべてのノードでスナップショットを作成する必要はありませんよね?
スナップショットは、すべての memtables をディスクにフラッシュ (つまり、sstables を作成) して、すべての最新のノード データがスナップショットに存在するようにします。このコマンドはノード レベルで機能します。つまり、すべてのノードを一度にバックアップするのではなく、ノードごとに最新のデータをバックアップします。
DataStax ドキュメントに記載されているアドバイスは、すべてのデータを同時にバックアップする場合は、リクエストを並行して実行できるコマンドライン ユーティリティを使用する必要があるというものです (推奨されるユーティリティはpsshです)。
最新のデータが提供される場合、クラスター内のすべてのノードでスナップショットを作成する必要はありませんよね?
単一ノード環境を実行していない限り、Cassandra を使用しているときにデータを毎日バックアップする必要があるケースは実際には見当たりません (C* の場合は少し無意味に思えます)。レプリケーション ファクターが十分に高い場合、データは常にバックアップされます。すべてのサーバー (クラスター全体) が同時に爆発するような壊滅的なハードウェア障害が予想される場合を除き、毎日バックアップする必要はありません。