実際のサイズ (VMware ディスク) で約 80GB の 200GB のスパース ファイルがあります。
Google はこのファイルの容量をどのように計算しますか? 200 GB または 80 GB?
gsutil
(のようなrsync -S
)を使用して Google Cloud に保存するベスト プラクティスは何ですかを使用して解決し
tar cSf
、経由でアップロードしgsutil
ますか? どのくらい遅くなる可能性がありますか?
実際のサイズ (VMware ディスク) で約 80GB の 200GB のスパース ファイルがあります。
Google はこのファイルの容量をどのように計算しますか? 200 GB または 80 GB?
gsutil
(のようなrsync -S
)を使用して Google Cloud に保存するベスト プラクティスは何ですか
を使用して解決しtar cSf
、経由でアップロードしgsutil
ますか? どのくらい遅くなる可能性がありますか?
実際のサイズ (VMware ディスク) で約 80GB の 200GB のスパース ファイルがあります。
- Google はこのファイルの容量をどのように計算しますか? 200 GB または 80 GB?
Google Cloud Storage は、ファイルが何であるかを理解するためにファイルをイントロスペクトしません。そのため、問題になるのはディスク上での実際のサイズ (80 GB) です。
gsutil
(のようなrsync -S
)を使用して Google Cloud に保存するベスト プラクティスは何ですか
ありますgsutil rsync
が、-S をサポートしていないため、あまり効率的ではありません。また、Google Cloud Storage はファイルをランダムにアクセスして書き換えることができるブロックとして保存するのではなく、バケット名 + オブジェクト名でキー付けされた blob として保存するため、基本的に毎回 80 GB のファイル全体をアップロードすることになります。
次のワークフローで、ファイルへのブロック レベルのアクセスを提供する永続ディスクを使用することを検討してください。
ワンタイムセットアップ:
事前同期セットアップ:
同期:
同期後のティアダウン:
スクリプトを使用してセットアップとティアダウンの手順を自動化できるため、同期を実行したいときに定期的に実行するのは非常に簡単です。
- を使用して解決し
tar cSf
、経由でアップロードしgsutil
ますか? どのくらい遅くなる可能性がありますか?
上記の方法はネットワーク接続によって制限され、他のサーバーへの ssh+rsync と同じです。たとえば、自分のネットワーク上の別のサーバーに人為的に帯域幅を調整して、外部アップロード速度と一致させ、ssh 経由で rsync を実行してテストすることでテストできます。
上記でカバーされていないのは価格設定です。そのため、分析で考慮する必要がある可能性があるため、これらの指針を残しておきます。
Google Cloud Storage モードを使用すると、次のことが発生します。
永続ディスクのアプローチを使用すると、次のことが発生します。
ダウンロードするデータの実際の量は、rsync が最小化することになっているため、少なくする必要があります。したがって、ほとんどのデータはダウンロードではなくアップロードする必要があります。したがって、ネットワーク コストは低くなるはずですが、それは実際の rsync に基づいています私が話すことができない実装。
お役に立てれば。