5

VMware イメージをバックアップするために作成しているソフトウェアにデータ重複排除を統合したいと考えています。私が必要だと思うものに適したものを見つけることができませんでした。何らかの形式の重複排除を含む完全なソリューションがたくさんあるようです。これらには、パブリック クラウドまたはプライベート クラウド、特殊なファイル システム、ストレージ ネットワークまたはデバイスなどを使用するストレージまたはバックアップ ソリューションが含まれます。ただし、独自のソリューションを開発し、それに重複除外を統合する必要があります。私のソフトウェアは C# で書かれているので、API を呼び出して何を重複排除するかを指示できるようにしたいと考えています。

私が話している重複排除のタイプは、あるイメージを別のイメージに対して重複排除することではありません。通常、何かの 2 つの「バージョン」の増分バックアップまたは差分バックアップを作成する方法です。はすでにそれを行うためのソリューションを持っており、さらに一歩進めたいと考えています。

私は、何らかの方法でグローバルレベルでデータのチャンクを重複排除できるようにするアプローチを想定しています (つまり、グローバルな重複排除の何らかの形式)。グローバルであるためには、検査対象のデータのコピーがすでに保持されており、再度保存する必要がないことを重複排除プログラムに伝える、ある種の中央ルックアップ テーブル (ハッシュのインデックスなど) があると思います。チャンクは、ファイル レベル (単一インスタンス ストレージまたは SIS) またはサブファイル/ブロック レベルの重複排除である可能性があります。後者はより効率的である必要があり (処理オーバーヘッドよりも重要です)、私の好みのオプションですが、必要に応じて SIS も機能させることができます。

上で述べたように、重複排除を行う他の人のソフトウェアについて多くのことを読みました。他の誰かのアプローチを具体的にエミュレートしようとしているわけではないので、ここでは例を挙げません。むしろ、私はプログラマー向けの解決策を見つけることができず、そのようなものが利用可能かどうかを知りたい. 別の方法としては、独自のソリューションを作成することもできますが、控えめに言っても、それはかなり大きな作業になります。

ありがとう。

4

1 に答える 1