3

テキストベースのファイルの git バージョン管理と大きなバイナリ ファイル (データなど) の rsync のようなものを効果的に組み合わせることができるプロジェクトを知っている人はいますか? 明らかに、これは DVCS が行うべきことを少し超えていますが、中央リポジトリと同期するために、git の周りにスマートなラッパーを書いた人がいるかどうかに興味があります。

4

2 に答える 2

3

git-annexが好きかもしれません。そのホームページから:

git-annex を使用すると、ファイルの内容を git にチェックインすることなく、git でファイルを管理できます。逆説的に思えるかもしれませんが、メモリ、時間、またはディスク容量の制限が原因で、git が現在簡単に処理できないサイズのファイルを処理する場合に便利です。

ファイル コンテンツの追跡がなくても、git を使用してファイルを管理したり、バージョン管理されたディレクトリ ツリーを使用してファイルを移動および削除したり、ブランチや分散クローンを使用したりできることはすべて、git を使用する非常に便利な理由です。また、付属ファイルは、定期的にバージョン管理されたファイルと同じ git リポジトリに共存できます。これは、付属ファイルに関連付けられているが完全なリビジョン管理の恩恵を受けるドキュメント、Makefile などを維持するのに便利です。

于 2012-07-01T14:25:59.853 に答える
2

私が最後に見たものはbupと呼ばれています

bupは物事をバックアップするプログラムです。「バックアップ」の略です。

bupには、他のバックアップソフトウェアに比べていくつかの利点があります。

  • ローリングチェックサムアルゴリズム(rsyncと同様)を使用して、大きなファイルをチャンクに分割します。これの最も有用な結果は、巨大な仮想マシン(VM)ディスクイメージ、データベース、およびXMLファイルを段階的にバックアップできることです。これらは通常、すべて1つの巨大なファイルにあり、複数のバージョンに大量のディスク領域を使用しません。
  • git(オープンソースバージョン管理システム)のpackfile形式を使用しているため、bupのユーザーインターフェイスが気に入らなくても、保存されているデータにアクセスできます。
  • gitとは異なり、(個別のガベージコレクション/再パック段階ではなく)パックファイルを直接書き込むため、不必要に大量のデータがある場合でも高速です。bupの改善されたインデックス形式により、git(百万)よりもはるかに多くのファイル名を追跡し、はるかに多くのオブジェクト(数百または数千ギガバイト)を追跡することもできます。
  • データは、どのバックアップが他のどのバックアップに基づいているかを知らなくても、増分バックアップ間で「自動的に」共有されます。バックアップが、お互いを知らない2台の異なるコンピューターから作成された場合でも同様です。bupにバックアップを指示するだけで、必要な最小限のデータのみが保存されます。
于 2012-07-01T13:55:38.073 に答える