重複の可能性:
SHA1衝突の可能性
ファイルシステム内の重複ファイルを識別しようとしているとしましょう。ファイルのSHA1チェックサムが一致する場合、それらは同一であると言っても安全でしょうか?それらが一致する場合、私もそれらの内容を調べる必要がありますか?
攻撃の理論的な複雑さは2^51のハッシュ関数呼び出しであることを読みました。また、 SOで、「160ビットを出力するSHA1の場合、誕生日攻撃によって複雑さが2^80に減少します。これは30年以上安全であるはずです」と読んだことがあります。それでも、ファイルの内容が一致することを確認するために再確認する必要がありますか?テストスクリプトで実行したときに、割り当てによって誤った出力が生成されないようにする必要があります。