zlib の adler32 関数を使用して、メモリ x (長さ 4096) のチャンクの弱いチェックサムを計算しています。すべて問題ありませんが、別のファイルのチャンクが一致しない場合は、ローリング チェックサムを実行したいと思います。ただし、zlib で adler32 によって返された値に対してそれを実行する関数を作成する方法がわかりません。チェックサムが一致しない場合、元のチェックサム x + 1 バイトと x + 4096 + 1 を使用してローリング チェックサムを計算するにはどうすればよいでしょうか。基本的にrsyncの実装を構築しようとしています。
質問する
2264 次
1 に答える
6
Pysync は、次のように zlib の Adler32 の上にローリングを実装しています。
_BASE=65521 # largest prime smaller than 65536
_NMAX=5552 # largest n such that 255n(n+1)/2 + (n+1)(BASE-1) <= 2^32-1
_OFFS=1 # default initial s1 offset
import zlib
class adler32:
def __init__(self,data=''):
value = zlib.adler32(data,_OFFS)
self.s2, self.s1 = (value >> 16) & 0xffff, value & 0xffff
self.count=len(data)
def update(self,data):
value = zlib.adler32(data, (self.s2<<16) | self.s1)
self.s2, self.s1 = (value >> 16) & 0xffff, value & 0xffff
self.count = self.count+len(data)
def rotate(self,x1,xn):
x1,xn=ord(x1),ord(xn)
self.s1=(self.s1 - x1 + xn) % _BASE
self.s2=(self.s2 - self.count*x1 + self.s1 - _OFFS) % _BASE
def digest(self):
return (self.s2<<16) | self.s1
def copy(self):
n=adler32()
n.count,n.s1,n.s2=self.count,self.s1,self.s2
return n
しかし、Peter が述べたように、rsync は Adler32 を直接使用するのではなく、Adler32 のより高速なバリアントを使用します。
rsyncツールのコードは少し読みにくいですが、 librsyncをチェックアウトしてください。これは完全に別のプロジェクトであり、はるかに読みやすくなっています。とを見てrollsum.c
くださいrollsum.h
。C マクロには、バリアントの効率的な実装があります。
/* the Rollsum struct type*/
typedef struct _Rollsum {
unsigned long count; /* count of bytes included in sum */
unsigned long s1; /* s1 part of sum */
unsigned long s2; /* s2 part of sum */
} Rollsum;
#define ROLLSUM_CHAR_OFFSET 31
#define RollsumInit(sum) { \
(sum)->count=(sum)->s1=(sum)->s2=0; \
}
#define RollsumRotate(sum,out,in) { \
(sum)->s1 += (unsigned char)(in) - (unsigned char)(out); \
(sum)->s2 += (sum)->s1 - (sum)->count*((unsigned char)(out)+ROLLSUM_CHAR_OFFSET); \
}
#define RollsumRollin(sum,c) { \
(sum)->s1 += ((unsigned char)(c)+ROLLSUM_CHAR_OFFSET); \
(sum)->s2 += (sum)->s1; \
(sum)->count++; \
}
#define RollsumRollout(sum,c) { \
(sum)->s1 -= ((unsigned char)(c)+ROLLSUM_CHAR_OFFSET); \
(sum)->s2 -= (sum)->count*((unsigned char)(c)+ROLLSUM_CHAR_OFFSET); \
(sum)->count--; \
}
#define RollsumDigest(sum) (((sum)->s2 << 16) | ((sum)->s1 & 0xffff))
于 2011-12-27T20:48:02.150 に答える