nodetool repair
Cassandra ノードで定期的に実行すると機能しなくなりますか?
Planet Cassandra FAQには、次のように記されています (強調を追加)。
アンチエントロピー ノード修復 – 頻繁に読み取られないデータの場合、または長期間ダウンしていたノード上のデータを更新する場合、ノード修復プロセス (アンチエントロピー修復とも呼ばれます) により、ノード上のすべてのデータがレプリカの一貫性が保たれます。ノードの修復 (nodetool ユーティリティを使用)は、通常のクラスタ メンテナンス操作の一環として定期的に実行する必要があります。
nodetool repair
これは、定期的に実行されていると私が見た唯一のリファレンスです。安ければ定期的に走らせても問題ないのですが、どのくらい高いのでしょうか?ノード上のすべてのレコードの一貫性チェック読み取りと同等のことを行いますか? それともそれよりも賢いですか?ドキュメントには、マークル ツリーの使用について言及されていますが、操作がどれほど高価であるかはわかりません。
ノードに 500 GB のデータがあり、そのノードが実際には他のノードと一致している場合 (修復はノーオペレーションです)、修復がディスクから読み取るデータの量について (500 GB すべてを読み取るには数時間かかります)時間)?そして、LAN 経由で送信されるデータの量について (LAN 経由で 500 GB をすべて送信するには、さらに 1 時間ほどかかる場合があります)。