活発に開発されている分散型の高可用性ファイルシステム(Linux 用) はありますか?
もっと具体的に言ってみましょう:
分散型とは、世界中のパブリック インターネットで見られるようなクライアントからサーバーへのレイテンシ (300 ミリ秒以上が一般的) や時折発生する接続の不安定性を適切に処理することを意味します。これは、非常に優れたクライアント側のキャッシュ (つまり、コールバックを使用) が必要であることを意味します。NFS はこれを行いません。また、IPSEC VPN を必要とせずに、通信中のデータを暗号化することも意味します。
高可用性とは、データを複数のサーバーに保存できることを意味し、クライアントは問題が発生した場合に別のサーバーを試すことができます。そのインテリジェンスをクライアントに組み込むことは非常に重要であり、そのため、この種のものを NFS にそのまま移植することはできません。少なくとも、これは読み取り専用データに対して可能である必要があります。読み書き可能なデータにはいいのですが、それが難しいことはわかっています。
ファイルシステムとは、カーネル ドライバーが POSIX インターフェースをエクスポートすることを意味し、信頼できないクライアントに直面して権限とアクセス制御が強制されます。SAN システムは、多くの場合、クライアントが信頼できるものであると想定しています。
私は OpenAFS 難民です。私はそれを気に入っていますが、現時点では、すべてのファイル サーバーが他のすべてのファイル サーバー上で事実上「ルートを持っている」という要件を受け入れることができません。独自のディスク形式と、Kerberos インフラストラクチャを実行する必要があることによるオーバーヘッド (これがなければ必要ない) も、ますます問題になっています。
これらの特性を持つ OpenAFS 以外のシステムはありますか? Intermezzo と Coda はおそらく適格ですが、もはやアクティブなプロジェクトではありません。Lustre はクールですが、超低レイテンシーのデータセンター向けに設計されているようです。Ceph は素晴らしいですが、実際にはファイルシステムではなく、ファイルシステムの下で実行されるものです (はい、CephFS はありますが、実際には Ceph のショーケースであり、明示的に本番環境に対応しておらず、その予定はありません)。Tahoe-LAFS はクールですが、カーネル モジュールを介して POSIX インターフェイスをエクスポートしないという点で、Tahoe-LAFS と GoogleFS は実際にはファイル システムではありません。GFS (Global Filesystem) についての私の理解では、クライアントはディスク上のデータ構造を直接操作できるため、暗黙的にルートレベルで信頼されている (これが高速な理由の一部です)。間違っていたら訂正してくださいここ。
データを独自のものに閉じ込めておく余裕がないため、オープンソースである必要があります。ソフトウェアにお金を払っても構いませんが、この状況で人質にとられるわけにはいきません。
ありがとう、