glibの答えは、データが異なるためチェックサムです。
私がこれを確認した実験:
まず、pdf をバーストしてファイルを移動します。
$pdftk Michael-Jordan-I-Cant-Accept-Not-Trying.pdf burst
$md5sum pg_0001.pdf
150ef33eec73cd13c957194ebead0e93 pg_0001.pdf
$mv pg_0001.pdf 150ef33eec73cd13c957194ebead0e93
次に、同じ pdf を再度バーストし、ファイルを移動します。
$pdftk Michael-Jordan-I-Cant-Accept-Not-Trying.pdf burst
$md5sum pg_0001.pdf
49c7c885bc516856f4316452029e0626 pg_0001.pdf
$mv pg_0001.pdf 49c7c885bc516856f4316452029e0626
これにより、あなたの発見が確認されました。金額が異なります。調べると、異なるのはバイト 91411 ~ 92163 です。
私の直感では、これは日付のメタデータであることがわかったので、次のように確認しました。
$pdftk 150ef33eec73cd13c957194ebead0e93 dump_data output 150.txt
$pdftk 49c7c885bc516856f4316452029e0626 dump_data output 49c.txt
$diff -u 150.txt 49c.txt
--- 150.txt 2012-07-10 11:08:02.371119999 -0600
+++ 49c.txt 2012-07-10 11:08:18.891201910 -0600
@@ -3,9 +3,9 @@
InfoKey: Producer
InfoValue: itext-paulo-155 (itextpdf.sf.net-lowagie.com)
InfoKey: ModDate
-InfoValue: D:20120710105934-06'00'
+InfoValue: D:20120710110010-06'00'
InfoKey: CreationDate
-InfoValue: D:20120710105934-06'00'
-PdfID0: 51671a1a6c4f5e6bb81b88fc7efd14d0
-PdfID1: 82fd646061863972216ccf8a32cf3c7b
+InfoValue: D:20120710110010-06'00'
+PdfID0: 844f34f87275b9184ebe10b82d3397c9
+PdfID1: 8f555a30216e37d77abaf03a4217b2a
NumberOfPages: 1
あなたの問題が何であるかはわかりませんが、一致する合計が本当に必要な場合は、次の 2 つの明白なアプローチがあります。
- 日付が同じになるように設定します。
- 最初の N バイトのみを使用して合計を計算します。問題のあるメタデータを省略します。