4

データセンターから Google Compute Engine に移行しようとしています。インスタンスをセットアップしてワークロードをデプロイする方法は理解していますが、データを保存するのに最も適した方法が何であるかはわかりません。私たちは毎日 1 回データを受信して​​おり、過去 1 ~ 2 年間に受信したデータについて、すべてのサーバーで終日実行されている調査があります。ポインタはありますか?

4

2 に答える 2

3

NFS のような共有ファイル サーバーを探しているようですね。単一の GCE インスタンスで NFS サーバーを実行して、さまざまな計算ノードにデータを分散できます。Linux Documentation Projectには妥当なハウツーがあります。

もう 1 つのオプションは、 Google Cloud Storageなどのオブジェクト ストアを使用することです。これにより、バイナリ データのブロブをさまざまな名前で保存できます (クラウド ファイルシステムに少し似ています)。ソフトウェアが標準のファイル システム コマンドを使用してデータにアクセスする必要がある場合は、s3fuseなどの FUSE ファイル システムを使用して、Google ストレージ バケットを各マシンのファイルとディレクトリのセットとしてエクスポートできます。

2 つのオプションから選択する方法:

  1. すでに NFS を使用している場合は、オンサイトで使用しているのと同じ構成を引き続き使用する方が快適かもしれません。そうでない場合は、s3fuse と GCS を試してみることをお勧めします。
  2. 独自の NFS サーバーを実行している場合は、必要になる可能性のあるバックアップなどについて責任を負う必要があります。Google Cloud Storage は複数のサイト間で複製されるため、1 つのサイトでメンテナンスが発生した場合でも、データを読み書きできます。
  3. s3fuse のような FUSE ファイルシステムは、読み取りおよび書き込み操作をサポートする傾向がありますが、NFS が行う複雑なロック動作などをサポートしない場合があります。
  4. GCS に保存されているデータに対して行った読み取りと書き込みの回数に対して課金される場合があります。(覚えていません。GCE から GCS への/からのネットワーク トラフィックは無料だと思います。) 独自の NFS サーバーを実行することを選択した場合は、実行中のインスタンスと永続ディスクに加えて、ディスクへの読み取りおよび書き込み操作。

同じ分野のいくつかをカバーしているこの他のスタック オーバーフローの質問にも興味があるかもしれません: ディスクレス サーバーのストレージ オプション

于 2013-06-22T20:04:42.547 に答える