5

活発に開発されている分散型の高可用性ファイルシステム(Linux 用) はありますか?

もっと具体的に言ってみましょう:

  • 分散型とは、世界中のパブリック インターネットで見られるようなクライアントからサーバーへのレイテンシ (300 ミリ秒以上が一般的) や時折発生する接続の不安定性を適切に処理することを意味します。これは、非常に優れたクライアント側のキャッシュ (つまり、コールバックを使用) が必要であることを意味します。NFS はこれを行いません。また、IPSEC VPN を必要とせずに、通信中のデータを暗号化することも意味します。

  • 高可用性とは、データを複数のサーバーに保存できることを意味し、クライアントは問題が発生した場合に別のサーバーを試すことができます。そのインテリジェンスをクライアントに組み込むことは非常に重要であり、そのため、この種のものを NFS にそのまま移植することはできません。少なくとも、これは読み取り専用データに対して可能である必要があります。読み書き可能なデータにはいいのですが、それが難しいことはわかっています。

  • ファイルシステムとは、カーネル ドライバーが POSIX インターフェースをエクスポートすることを意味し、信頼できないクライアントに直面して権限とアクセス制御が強制されます。SAN システムは、多くの場合、クライアントが信頼できるものであると想定しています。

私は OpenAFS 難民です。私はそれを気に入っていますが、現時点では、すべてのファイル サーバーが他のすべてのファイル サーバー上で事実上「ルートを持っている」という要件を受け入れることができません。独自のディスク形式と、Kerberos インフラストラクチャを実行する必要があることによるオーバーヘッド (これがなければ必要ない) も、ますます問題になっています。

これらの特性を持つ OpenAFS 以外のシステムはありますか? Intermezzo と Coda はおそらく適格ですが、もはやアクティブなプロジェクトではありません。Lustre はクールですが、超低レイテンシーのデータセンター向けに設計されているようです。Ceph は素晴らしいですが、実際にはファイルシステムではなく、ファイルシステムの下で実行されるものです (はい、CephFS はありますが、実際には Ceph のショーケースであり、明示的に本番環境に対応しておらず、その予定はありません)。Tahoe-LAFS はクールですが、カーネル モジュールを介して POSIX インターフェイスをエクスポートしないという点で、Tahoe-LAFS と GoogleFS は実際にはファイル システムではありません。GFS (Global Filesystem) についての私の理解では、クライアントはディスク上のデータ構造を直接操作できるため、暗黙的にルートレベルで信頼されている (これが高速な理由の一部です)。間違っていたら訂正してくださいここ。

データを独自のものに閉じ込めておく余裕がないため、オープンソースである必要があります。ソフトウェアにお金を払っても構いませんが、この状況で人質にとられるわけにはいきません。

ありがとう、

4

1 に答える 1

2

まず第一に、fscache機能を介してcachefilesd ( Debianのcachefilesdパッケージで提供) を使用して、ローカル ファイル システム ( でマウント-o user_xattr) を使用して NFS ( でマウント) をキャッシュできます。-o fsc

あなたが探しているファイル システムはおそらく存在しませんが、私見の 2 つのプロジェクトは、かなり優れたFUSEクライアントの実装にかなり近づきました。

かなり長い間Cephを評価した結果、Cephには欠陥があり (近い将来に改善される見込みはありません)、本格的な使用には適していないという結論に達しました。XtreemFSもがっかりです。今後のOrangeFSバージョン 3 (データ整合性チェックが約束されている) がそれほど悪くないことを願っていますが、それはまだわかりません...

于 2014-12-25T23:09:07.440 に答える