メモリに収まらない可能性のある大きなtiffファイルのチェックサムを計算したいと思います。代わりに、すべてのページのチェックサムを計算してから、ページのチェックサムの配列のチェックサムを計算すると、信頼できる値が得られますか、それとも、表示されていない数学の問題に遭遇し、それを行う唯一の正しい方法は、事実はすべてで動作しますか?
ありがとう!
質問を正しく理解したかどうかはわかりませんが、ほとんどのチェックサムアルゴリズムでは、メッセージのごく一部をメモリにロードするだけで済みます。そのため、メモリ位置の代わりにストリームを操作することが可能であり、以前に実行されていました。
編集:
ショートメッセージをチェックサムするときはAdler-32に注意する必要があることだけを知っています。ハッシュスペース全体をカバーすることはできず、誤検知が発生する可能性が高くなります(チェックサムの配列はおそらくショートメッセージになります)。
暗号化ハッシュでは、正直なところわかりません。私の直感では、md5(msg1 + msg2 + ...)はmd5(md5(msg1)+ md5(msg2)+ ...)と同じくらい信頼できますが、私より賢い人が決定的な答えを出すのを待つ必要があります:)